Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica...

287
Note Metodi geometrici per la fisica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

Transcript of Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica...

Page 1: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

NoteMetodi geometrici per la fisica matematica

Anno Accademico 2008-2009

S. Cacciatori B. van Geemen

versione 07.0

1

Page 2: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

INDICE 2

Indice

1 Algebra multilineare 51.1 Tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Tensori in fisica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.3 L’algebra esterna. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2 Rappresentazioni di gruppi finiti 282.1 Teoria generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.2 Caratteri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.3 Le classi di coniugio di Sm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362.4 Le rappresentazioni irriducibili del gruppo simmetrico . . . . . . . . . . . . . . . 39

3 Tensori e gruppo simmetrico 453.1 Introduzione e risultati generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 453.2 I funtori di Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.3 Esempi: T 3V e T 4V . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4 Geometria differenziale 584.1 Richiami di analisi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.2 Varieta differenziabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.3 Spazi e fibrati tangenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.4 Forme differenziali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 694.5 Geometria differenziale e meccanica . . . . . . . . . . . . . . . . . . . . . . . . . 74

5 Gruppi e algebre di Lie 835.1 Gruppi di Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 835.2 Algebre di Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 865.3 Rappresentazioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 915.4 Algebre di Lie semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 945.5 Le rappresentazioni irriducibili dell’algebra di Lie sl(2) . . . . . . . . . . . . . . 975.6 Rappresentazioni di sl(2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

6 Le rappresentazioni dell’algebra di Lie sl(3) 1036.1 L’algebra di Lie sl(3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1036.2 Pesi: integralita e simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1096.3 Il peso massimale di una rappresentazione irriducibile . . . . . . . . . . . . . . . 1126.4 Le rappresentazioni irriducibili di sl(3) . . . . . . . . . . . . . . . . . . . . . . . 1156.5 Le rappresentazioni irriducibili di sl(3) . . . . . . . . . . . . . . . . . . . . . . . 1176.6 La forma di Killing per sl(3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

7 La classificazione delle algebre di Lie semisemplici 1307.1 L’algebra di Cartan e i pesi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1307.2 Sistemi di radici e diagrammi di Dynkin . . . . . . . . . . . . . . . . . . . . . . 138

Page 3: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

INDICE 3

7.3 Diagrammi di Dynkin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1397.4 Algebre di Lie semplici reali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

8 Rappresentazioni di algebre di Lie semplici 1468.1 Pesi: integralita e simmetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1468.2 Il peso massimale di una rappresentazione irriducibile . . . . . . . . . . . . . . . 1488.3 Le rappresentazioni irriducibili di sl(n) . . . . . . . . . . . . . . . . . . . . . . . 153

9 Gruppi ortogonali 1579.1 Forme bilineari simmetriche e forme quadratiche . . . . . . . . . . . . . . . . . . 1579.2 Esempi di gruppi ortogonali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1599.3 Quaternioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1639.4 Il gruppo ortogonale SO(2m) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1659.5 Il gruppo ortogonale SO(2m+ 1) . . . . . . . . . . . . . . . . . . . . . . . . . 169

10 Rappresentazioni di Spin 17210.1 L’algebra di Clifford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17210.2 L’algebra di Clifford e il gruppo spinoriale. . . . . . . . . . . . . . . . . . . . . . 17510.3 Le rappresentazioni spinoriali di so(n). . . . . . . . . . . . . . . . . . . . . . . . 180

11 Strutture geometriche 18611.1 Fibrati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18611.2 Geometria e gruppi di Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19411.3 Connessioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19811.4 Derivate covarianti (connessioni di Koszul) . . . . . . . . . . . . . . . . . . . . . 20511.5 Curvature . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21111.6 Strutture Riemanniane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

12 Teoria dinamica delle simmetrie. 22712.1 Campi di materia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22712.2 Campi di gauge. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23012.3 Teorie di Yang-Mills. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23412.4 Simmetrie esterne e relativita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

13 Campi scalari e spinoriali. 24413.1 Le particelle e il gruppo di Poincare. . . . . . . . . . . . . . . . . . . . . . . . . 24413.2 Equazione di Klein-Gordon. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24913.3 Equazione di Dirac. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25113.4 Il gruppo SO(1, 3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25613.5 Campi di spin 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26213.6 Campi e gravita (cenni). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262

Page 4: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

INDICE 4

14 Geometria del Modello Standard e GUT. 26514.1 I campi del modello standard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26514.2 Costruzione del Modello Standard. . . . . . . . . . . . . . . . . . . . . . . . . . 27014.3 La massa dei neutrini. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276

14.3.1 Il meccanismo dell’altalena (Seesaw mechanism). . . . . . . . . . . . . . . 27714.4 Teorie GUT (cenni). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278

Page 5: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 5

1 Algebra multilineare

Testi consigliati: [A], [MB].

1.1 Tensori

1.1.1 Lo spazio duale. Sia V uno spazio vettoriale reale di dimensione n. Scelta unabase e1, . . . , en di V ogni x ∈ V si scrive in modo unico come combinazione lineare x =x1e1 + . . .+ xnen con xi ∈ R. In questo modo si ottiene un isomorfismo

V∼=−→ Rn, x = (x1, x2, . . . , xn) =

x1...xn

.

Lo spazio duale V ∗ di V e lo spazio vettoriale reale delle applicazioni R-lineari da V a R:

V ∗ := HomR(V,R) = l : V → R, l R-lineare.

Si ricordi che per l,m ∈ V ∗ e λ, µ ∈ R l’elemento λl + µm dello spazio vettoriale V ∗ e definitoda:

(λl + µm)(x) := λl(x) + µm(x) (x ∈ V ).

Poiche e lineare, l e determinata dalle l(ei) ∈ R:

l(x) = l(x1e1 + . . .+ xnen) = x1l(e1) + . . .+ xnl(en) = (l(e1) ; l(e2) ; . . . ; l(en))

x1...xn

.

Data la base ei, l si identifica con un’applicazione lineare Rn → R che e data da una matrice,ancora indicata con l, con una sola riga e n colonne i cui coefficienti sono le immagini dei vettoridi base: l = (a1 ; a2 ; . . . ; an) con ai := l(ei).

1.1.2 La base duale. Data la base ei di V , si ottiene in modo canonico una base ε1, . . . , εndi V ∗, detta la base duale, che e definita da:

εj : V −→ R, εj(∑

xiei) = xj

cioe εj(ei) = δij dove δ e la δ di Kronecker: δij = 0 se i 6= j e δij = 1 se i = j. Si noti cheε1 = (1 0 . . . 0),. . .,εn = (0 0 . . . 1).

1.1.3 L’applicazione duale. Dati gli spazi vettoriali V,W , di dimensione n e r rispettiva-mente, abbiamo definito i loro spazi duali V ∗,W ∗. Adesso consideriamo un’applicazione linearef : V → W . Essa induce un’applicazione lineare

f ∗ : W ∗ −→ V ∗, m 7−→ m f,

Page 6: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 6

cioe, se m : W → R e lineare, definiamo f ∗m ∈ V ∗ con (f ∗m)(v) := m(f(v)). L’ applicazionef ∗ e detta applicazione duale di f oppure applicazione aggiunta.

Sia A la matrice di f : V → W e M = (m1 . . . mr) la matrice di m : W ∼= Rr → R rispettoalle basi ei, fj di V e W rispettivamente. Siccome m(f(x)) = MAx, troviamo che la matricedi f ∗(m) e MA.

La base duale ηj di W da un isomorfismo W ∗ ∼= Rr, e l’elemento m =∑

jmjηj ∈ W ∗

corrisponde al vettore (m1, . . . ,mr) che e tM , una matrice con r righe e una sola colonna. Seusiamo la base duale delle ei come base di V ∗, la matrice di f ∗ e allora tA perche t(MA) = tAtM .Quindi se f : V → W e dato da una matrice A, allora, rispetto alle base duale f ∗ : W ∗ → V ∗

e dato dalla matrice tA.

1.1.4 Motivazione. Per motivare il prodotto tensoriale tra due spazi vettoriali, consideriamolo spazio delle applicazioni lineari V → W dove anche W e uno spazio vettoriale su R didimensione finita, dimW = m. Data una base f1, . . . , fm di W e una f ∈ HomR(V,W ) sia

f(ej) =m∑i=1

aijfi (f ∈ HomR(V,W ))

cioe la matrice (aij) e la matrice determinata da f . Sfruttando il fatto che εj(x) = xj si ha:

f(x) = f(∑j

xjej) =∑j

xjf(ej) =∑j

εj(x)f(ej) =∑i,j

aijεj(x)fi.

Percio f e una combinazione lineare delle applicazioni lineari x 7→ εj(x)fi. Questo si vede anchefacilmente utilizzando il prodotto matriciale, per esempio:(

a11 a12

a21 a22

)= a11

(10

)(1 0) + a12

(10

)(0 1) + a21

(01

)(1 0) + a22

(01

)(0 1).

(Si noti che il vettore ei ∈ V e identificato con l’applicazione lineare R → V che manda λ inλei.) Quindi, in un certo senso, Hom(V,W ) e un ‘prodotto’ degli spazi vettoriali V ∗ e W ; ognielemento f ∈ Hom(V,W ) e una combinazione lineare di ‘prodotti’ di elementi di V ∗ e di W . Siveda 1.1.9 per definizioni precise.

1.1.5 Il prodotto tensoriale. Dati gli spazi vettoriali reali V,W di dimensione rispetti-vamente n e m, definiamo uno spazio vettoriale reale V ⊗W di dimensione nm, il prodottotensoriale di V e W . Gli elementi di V ⊗W sono combinazioni R-lineari di ‘tensori puri’ v⊗wcon v ∈ V,w ∈ W . Vogliamo che siano valide le ‘solite’ regole per un prodotto:

(v1 + v2)⊗ w = v1 ⊗ w + v2 ⊗ w,v ⊗ (w1 + w2) = v ⊗ w1 + v ⊗ w2,

a(v ⊗ w) = (av)⊗ w = v ⊗ (aw).

Per ottenere lo spazio vettoriale ‘piu grande possibile’ nel quale valgono queste regole,consideriamo lo spazio vettoriale F (V,W ) che ha come base tutte le coppie (v, w) con v ∈

Page 7: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 7

V,w ∈ W . In particolare, se V o W non e lo spazio 0, F (V,W ) ha dimensione infinita!Un elemento f ∈ F (V,W ) si scrive, in modo unico, come f =

∑<∞i ri(vi, wi) dove ri ∈ R

e (vi, wi) ∈ V × W sono coppie distinte. In F (V,W ) consideriamo il sottospazio vettorialeR(V,W ) generato dai seguenti elementi di F (V,W ):

(v1 + v2, w)− (v1, w)− (v2, w),(v, w1 + w2)− (v, w1)− (v, w2),

a(v, w)− (av, w),a(v, w)− (v, aw),

dove v1, v2 ∈ V , w1, w2 ∈ W ed a ∈ R.Definiamo il prodotto tensoriale di V e W , denotato con V ⊗W , come lo spazio quoziente:

V ⊗W := F (V,W )/R(V,W ), con v ⊗ w := (v, w) = (v, w) +R(V,W ),

cioe, ogni elemento t ∈ V ⊗W e una classe laterale: t = f+R(V,W ) per un certo f ∈ F (V,W ),che di solito indicheremo con t = f , e v ⊗ w e la classe laterale definita da (v, w) ∈ F (V,W ).Si ricordi che f = g se e solo se f − g ∈ R(V,W ). Le operazioni in un spazio quoziente sonof + g = f + g e λ · f = λf . Siccome f = 0 per ogni f ∈ R(V,W ), otteniamo per esempio:

0 = (v1 + v2, w)− (v1, w)− (v2, w)

= (v1 + v2, w)− (v1, w)− (v2, w)

= (v1 + v2)⊗ w − (v1 ⊗ w)− (v2 ⊗ w),

quindi, se scriviamo 0 = 0 ∈ V ⊗W , vediamo che vale la prima regola. Nello stesso modo siverificano le altre regole. Poiche abbiamo imposto su F (V,W ) soltanto le relazioni di R(V,W ),V ⊗W e lo spazio piu grande nel quale queste valgono.

1.1.6 Una base del prodotto tensoriale. Siano ei e fj basi di V e W rispettivamente.Dato v =

∑i viei ∈ V e w =

∑j wjfj ∈ W abbiamo, usando le regole qui sopra:

v ⊗ w = (∑

i viei)⊗ w

=∑

i(viei)⊗ w

=∑

i vi(ei ⊗ (∑

j wjfj))

= . . .

=∑

i,j viwj(ei ⊗ fj).

Ogni elemento di F (v, w) e una combinazione lineare delle coppie (v, w), quindi ogni elementodi V ⊗ W = F (V,W )/R(V,W ) e una combinazione delle v ⊗ w. Come appena mostrato,ogni v ⊗ w e combinazione lineare degli ea ⊗ fb con a = 1, . . . , n e b = 1, . . . ,m. Quindiogni elemento di V ⊗ W e combinazione lineare degli nm elementi ea ⊗ fb, in particolare

Page 8: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 8

dimV ⊗ W ≤ nm = (dimV )(dimW ). Per mostrare che si ha l’ uguaglianza, sfruttiamol’applicazione lineare

φa,b : F (V,W ) −→ R, (v, w) 7−→ vawb

(si ricordi che i (v, w) sono una base di F (V,W )). Si verifica che φa,b(R(V,W )) = 0, quindiφa,b da un’applicazione ben definita φa,b : V ⊗W → R. L’immagine di ei ⊗ fj e zero tranne sei = a, j = b e percio gli ei⊗fj sono indipendenti e sono quindi una base di V ⊗W . Concludiamoche

dimV ⊗W = (dimV )(dimW ), V ⊗W = ⊕i,jRei ⊗ fj.

1.1.7 Applicazioni bilineari e prodotto tensoriale. Il prodotto tensoriale di due spazivettoriali e definito come un quoziente. Percio per definire un’applicazione lineare f : V ⊗W →U , dove U e uno spazio vettoriale, bisogna sempre verificare che sia ben definita, cioe, bisognaprima definire un’applicazione f : F (V,W ) → U che soddisfi le condizioni f(R(V,W )) = 0 ef((v, w)) = f(v ⊗ w), come abbiamo fatto per la applicazione f = φa,b con f = φa,b in 1.1.6.Adesso daremo un criterio piu facile che garantisce che f sia ben definita e, in piu, otterremouna descrizione di tutte le applicazioni lineari V ⊗W → U .

Un’applicazione

φ : V ×W −→ U, tale che

φ(λv1 + µv2, w) = λφ(v1, w) + µφ(v2, w),φ(v, λw1 + µw2) = λφ(v, w1) + µφ(v, w2)

per ogni λ, µ ∈ R, v, v1, v2 ∈ V e w,w1, w2 ∈ W e detta bilineare.Sia dunque φ : V ×W −→ U un’applicazione bilineare, allora definiamo un’applicazione

lineareΦ : F (V,W ) −→ U, Φ((v, w)) := φ(v, w).

Siccome φ e bilineare, abbiamo che Φ(R(V,W )) = 0, per esempio vale:

Φ((v1 + v2, w)− (v1, w)− (v2, w)) = Φ((v1 + v2, w))− Φ((v1, w))− Φ((v2, w))= φ(v1 + v2, w))− φ(v1, w)− φ(v2, w)= 0

perche φ(v1 + v2, w) = φ(v1, w) + φ(v2, w). Percio Φ definisce un’applicazione lineare (bendefinita)

Φ : V ⊗W −→ U, v ⊗ w 7−→ φ(v, w).

A questo punto si potrebbe ‘dimenticare’ l’applicazione Φ ricordando soltanto che:ogni applicazione bilineare φ : V ×W → U definisce un’applicazione lineare Φ : V ⊗W → Utale che Φ(v ⊗ w) = φ(v, w).

Viceversa, e facile verificare, usando le regole per ⊗ date in 1.1.5, che l’applicazione (dettaapplicazione bilineare universale)

B : V ×W −→ V ⊗W, (v, w) 7−→ v ⊗ w

e bilineare. In piu, si verifica che la composizione dell’applicazione bilineare B con ogni appli-cazione lineare f : V ⊗W → U e un’applicazione bilineare φ := f B : V ×W → U . Poiche

Page 9: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 9

φ(v, w) = f(B(v, w)) = f(v⊗w) concludiamo che f e l’applicazione lineare definita da φ comesopra, cioe f = Φ.

Risulta che abbiamo verificato:

1.1.8 Proprieta universale del prodotto tensoriale. Sia B l’applicazione bilineare uni-versale V × W → V ⊗ W , B(v, w) := v ⊗ w. Allora per ogni spazio vettoriale reale U didimensione finita e per ogni applicazione bilineare φ : V ×W → U esiste un’unica applicazionelineare Φ : V ⊗W → U tale che il diagramma

V ×W B−→ V ⊗Wφ ↓ Φ

U

sia commutativo, ovvero risulti: φ = Φ B.

1.1.9 Esempio: applicazioni lineari. Riprendiamo l’esempio motivante 1.1.4. Si verificache la applicazione

φ : V ∗ ×W −→ HomR(V,W ), (l , w) 7−→ [x 7−→ l(x)w]

e bilineare. Percio otteniamo un’applicazione lineare

Φ : V ∗ ⊗W∼=−→ HomR(V,W ), l ⊗ w 7−→ [x 7→ l(x)w] (l ∈ V ∗, w ∈ W,x ∈ V ).

Usando le basi εi e fj di V ∗ e W e facile vedere che Φ e iniettiva. Poiche dimV ∗ ⊗ W =dim HomR(V,W ), concludiamo che Φ e un isomorfismo:

Φ : V ∗ ⊗W∼=−→ HomR(V,W )

1.1.10 Esempio: applicazioni bilineari. L’insieme Bil(V,W ) delle applicazioni bilineariV ×W → R e uno spazio vettoriale con le operazioni:

(φ+ ψ)(v, w) := φ(v, w) + ψ(v, w), (λψ)(v, w) := λψ(v, w),

per φ, ψ ∈ Bil(V,W ), v ∈ V,w ∈ W e λ ∈ R.Se ei, fj sono basi di V e W e se φ e bilineare, abbiamo:

φ(∑i

xiei,∑j

yjfj) =∑

xiyjφ(ei, fj),

quindi un’applicazione bilineare e determinata dalle immagini delle coppie (ei, fj) ∈ V ×W .In particolare, otteniamo un isomorfismo di spazi vettoriali reali Bil(V,W ) ∼= Mn,m(R) doveMn,m(R) e lo spazio vettoriale delle matrici reali con n righe e m colonne. Segue chedim Bil(V,W ) = (dimV )(dimW ). Si noti che se M = (φ(ei, fj)) e la matrice determinatada φ, allora

φ(x, y) = txMy, (M = (φ(ei, fj)) ∈Mn,m(R)).

Page 10: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 10

Il fatto che xi = εi(x) e yj = ηj(y), dove ηj ∈ W ∗ e la base duale delle fj, suggerisce ilseguente risultato.

La proprieta universale del prodotto tensoriale mostra che l’ applicazione bilineare

V ∗ ×W ∗ −→ Bil(V,W ), (l,m) 7−→ [(x, y) 7−→ l(x)m(y)]

induce un’applicazione lineare

Ψ : V ∗ ⊗W ∗ −→ Bil(V,W ), l ⊗m 7−→ [(x, y) 7−→ l(x)m(y)].

E’ facile vedere (per esempio usando le basi) che questa applicazione e iniettiva e siccomedim(V ∗ ⊗W ∗) = dim Bil(V,W ) otteniamo che

Ψ : V ∗ ⊗W ∗ ∼=−→ Bil(V,W ).

Un altro modo di ottenere queso risultato e di osservare che in 1.1.7 abbiamo mostrato che

Bil(V,W )∼=−→ Hom(V ⊗W,R), φ 7−→ Ψ.

Siccome Hom(V ⊗W,R) = (V ⊗W )∗, lo spazio duale, basta verificare che (V ⊗W )∗ ∼= V ∗⊗W ∗.Per questo si puo usare l’ applicazione bilineare

V ∗ ×W ∗ −→ (V ⊗W )∗, (l,m) 7−→ [(x⊗ y) 7−→ l(x)m(y)],

lasciamo i dettagli come esercizio.

1.1.11 Funtorialita del prodotto tensoriale. Consideriamo le applicazioni lineari f : V1 →V2 e g : W1 → W2 tra spazi vettoriali reali di dimensione finita. E’ facile vedere che

V1 ×W1 −→ V2 ⊗W2, (v1, w1) 7−→ f(v1)⊗ g(w1)

e un’applicazione bilineare che induce percio un’applicazione lineare, indicata con f ⊗ g:

f ⊗ g : V1 ⊗W1 −→ V2 ⊗W2, v1 ⊗ w1 7−→ f(v1)⊗ g(w1).

Osserviamo l’isomorfismo evidente:

(V ⊗W )⊗ U ∼= V ⊗ (W ⊗ U), (v ⊗ w)⊗ u 7−→ v ⊗ (w ⊗ u),

che ci permette di scrivere semplicemente V ⊗W ⊗ U per entrambi questi spazi.

1.1.12 La rappresentazione controgradiente. Sia V uno spazio vettoriale di dimensionefinita. Il gruppo GL(V ) delle applicazioni lineari invertibili agisce su V : A(Bx) = (AB)xper x ∈ V . Per A ∈ GL(V ) e l ∈ V ∗, lo spazio duale, abbiamo definito l’applicazione duale(A∗l)(x) = l(Ax) (vedi 1.1.3). Si noti che questa non da un’azione di GL(V ) su V ∗:

(A∗(B∗l))(x) = (B∗l)(Ax) = l(BAx), invece ((AB)∗l)(x) = l(ABx);

Page 11: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 11

Poiche in generale AB 6= BA, non vale in generale A∗(B∗l) = (AB)∗l. Per questo motivodefiniamo per A ∈ GL(V ):

A : V ∗ −→ V ∗, l 7−→ [x 7−→ (Al)(x) := l(A−1x)], (A ∈ GL(V ), l ∈ V ∗, x ∈ V ).

Ora si ha una azione di GL(V ) su V ∗ perche:

(A(Bl))(x) = (Bl)(A−1x) = l(B−1A−1x) = l((AB)−1x) = ((AB)l)(x)

per ogni A,B ∈ GL(V ), l ∈ V ∗ e x ∈ V . Si noti che l’azione e tramite applicazioni lin-eari: A(λl + µm) = λAl + µAm. Abbiamo quindi ottenuto un omomorfismo di gruppi, dettorappresentazione controgradiente

GL(V ) −→ GL(V ∗), A 7−→ [l 7−→ Al] (A ∈ GL(V ), l ∈ V ∗).

Osserviamo che con questa defizione di Al si ha:

(Al)(Ax) = l(A−1Ax) = l(x),

cioe, il valore della trasformata della forma lineare nel trasformato del punto e il valore dellaforma lineare nel punto.

Come visto in 1.1.3, se A : V → V e dato dalla matrice, indicata ancora con A, rispettoa una base di V , allora rispetto alla base duale di V la mappa indotta V ∗ → V ∗ e data dallamatrice tA. Quindi la rappresentazione controgradiente

GL(V ) −→ GL(V ∗), A 7−→ A∗ := tA−1.

1.1.13 Azione di GL(V ) su T nm(V ). Per un intero k ∈ Z≥0 definiamo uno spazio vettoriale:

T 0(V ) = R, T 1(V ) = V, T k(V ) = V ⊗n := V ⊗ V ⊗ . . .⊗ V︸ ︷︷ ︸k

,

e poi, per interi n,m ∈ Z≥0 definiamo:

T nm(V ) := T n(V )⊗ Tm(V ∗),

si noti che T n(V )⊗T 0(V ∗) = T n(V )⊗R ∼= T n(V ) usando la applicazione (v1⊗ . . .⊗ vn)⊗λ 7→λ(v1 ⊗ . . .⊗ vn). Similmente T 0

m(V ) ∼= Tm(V ∗).Per A ∈ GL(V ) definiamo un’applicazione:

A = ρnm(A) : T nm(V ) −→ T nm(V )

x1 ⊗ x2 ⊗ . . . . . .⊗ xn ⊗ l1 ⊗ . . .⊗ lm 7−→ (Ax1)⊗ (Ax2)⊗ . . .⊗ (Axn)⊗ (Al1)⊗ . . .⊗ (Alm).

Non e difficile vedere che ρnm(AB) = ρnm(A)ρnm(B), cioe che GL(V ) agisce su T nm, e che ρnm(A)e un’applicazione lineare su T nm. Quindi otteniamo un omomorfismo di gruppi

ρnm : GL(V ) −→ GL(T nm(V )).

Page 12: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 12

Sia ei, 1 ≤ i ≤ n, una base di V . Si puo mostrare che se M ∈ Hom(V, V ) = V ∗ ⊗ V = T 11 e

data dalla matrice M = (mij) ∈Mn(R), allora l’azione di A ∈ GL(V ) su M e data da:

A ·M = AMA−1 (A ∈ GL(V ),M ∈ T 11 (V )).

Invece, se consideriamo un’applicazione bilineare ψ ∈ Bil(V, V ) ∼= V ∗ ⊗ V ∗ = T 02 (V ), data da

una matrice M = (mij) ∈Mn(R), allora l’azione di A ∈ GL(V ) su M e dato da:

A ·M = tA−1MA−1, (A ∈ GL(V ),M ∈ T 02 (V )).

(Si noti che l’azione di A ∈ GL(V ) su ψ ∈ Bil(V, V ) e dato da (Aψ)(x, y) = ψ(A−1x,A−1y) eche ψ(x, y) = txMy).

1.1.14 La complessificazione di uno spazio vettoriale reale. Sia V uno spazio vettorialereale. Definiamo uno spazio vettoriale complesso VC con un’applicazione iniettiva R-lineareV → VC tale che VC = V ⊕ iV , cioe, ogni elemente di VC si scrive, in modo unico, come sommav1 + iv2 con v1, v2 ∈ V . Nel caso che V = Rn, troviamo VC = Cn e l’inclusione Rn → Cn equella standard.

La definizione di VC e data da:VC := V ⊗R C

dove C e visto come spazio vettoriale di dimensione due su R. In particolare, VC e uno spaziovettoriale reale di dimensione 2 dimV . Per definire l’azione di C su VC (cioe il prodotto di unscalare t ∈ C con un vettore w ∈ VC) osserviamo che, per ogni t ∈ C, l’applicazione

φt : V × C −→ VC, (v, t) 7−→ v ⊗ (tz)

e R-bilineare e quindi definisce un’applicazione R-lineare Φt : VC → VC, v ⊗ z 7→ v ⊗ (tz).L’azione di C su VC e allora definito da t · (v ⊗ z) := v ⊗ (tz). E’ facile verificare che in questomodo VC e uno spazio vettoriale complesso. In piu, l’applicazione

V −→ VC, v 7−→ v ⊗ 1

e R-lineare e, poiche

v ⊗ (x+ iy) = (v ⊗ x) + (v ⊗ (iy)) = (xv)⊗ 1 + (yv)⊗ i (x, y ∈ R),

si ha VC = V ⊕ iV dove, per definizione della struttura di spazio vettoriale complesso su VC,iV = v ⊗ i : v ∈ V .

Una proprieta importante di VC e che ogni applicazione R-lineare A : V → V definisceun’applicazione C-lineare

AC : VC → VC, AC(v ⊗ z) := (Av)⊗ z (A ∈ HomR(V, V )),

come si verifica facilmente usando l’applicazione R-bilineare V × C→ VC, (v, z) 7→ (Av)⊗ z.

Page 13: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 13

Nel caso V ⊂ W , dove W e uno spazio vettoriale complesso, si ottiene un’applicazione C-lineare VC → W dato da v⊗z → zv (dove il prodotto zv e preso nel spazio vettoriale complessoW ). Un esempio interessante e il caso dove

V := X ∈ W = Mn(C) : tX +X = 0 .

Si noti che V e un sottospazio vettoriale reale di W , ma non un sottospazio vettoriale complesso(se X 6= 0 e tX = −X allora tiX = −itX = +iX 6= −iX, quindi iX 6∈ V ). Questo argomentomostra in realta che V ∩ iV = 0 e quindi, calcolando dimensioni (oppure vedi 7.4.3), si haW = V + iV e percio VC ∼= W .

1.2 Tensori in fisica

Gli elementi dello spazio vettoriale T nm(V ) si chiamano tensori di rango r = n+m, con n indicicontrovarianti ed m indici covarianti o anche tensori di tipo (n,m). In particolare i tensori ditipo (1, 0) sono i vettori di V detti anche vettori controvarianti, mentre i tensori di tipo (0, 1)vengono chiamati covettori o vettori covarianti. Le nozioni di covarianza e controvarianza sonodirettamente riconducibili al modo in cui GL(V ) agisce su T nm(V ). Vogliamo pero soffermarci aillustrarle da un punto di vista meno astratto, in maniera tale da rendere evidente l’importanzadei tensori in fisica e contemporaneamente giustificare le notazioni usualmente adottate.

1.2.1 Vettori, indici in alto e controvarianza. In prima approssimazione per un fisicouna grandezza vettoriale e una quantita specificata da una intensita (o modulo), una direzionee un verso. Per esempio il vettore posizione, o la velocita di una particella in un determinatoistante, o la forza che un corpo esercita su di un altro e cosı via. Per specificare un tale vettoreo eseguirne una misura e necessario introdurre un sistema di riferimento, che corrisponde allascelta di una base ordinata ~e1, ~e2, ~e3 dello spazio vettoriale V in cui il vettore, diciamo ~v,vive. Dunque

~v = v1~e1 + v2~e2 + v3~e3 ,

e la misura consistera nella determinazione delle componenti del vettore, cioe i coefficienti vi.Si noti che abbiamo scritto gli indici come apici. Questo e un fatto puramente convenzionaleche e pero universalmente adottato e come vedremo permette di semplificare le notazioni. Aquesto punto si puo essere tentati di identificare il vettore ~v con la terna delle sue componenti

v =

v1

v2

v3

.

Tale identificazione risulta essere inappropriata dato che mentre il vettore ~v prescinde dallascelta di una base, v non ha alcun significato senza tale base. E se infatti si decide di cambiarebase, il vettore ~v restera invariato, mentre le sue componenti ~v cambieranno ansse. Infattisupponiamo di introdurre la nuova base ~e1,~e2,~e3 legata alla precedente dalla matrice M =Mi

j da

~ei =3∑j=1

Mij~ej .

Page 14: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 14

Rispetto a questa base le nuove componenti v saranno tali per cui

~v = v1~e1 + v2~e2 + v3~e3 ,

e quindi ∑i

vi~ei =∑j

vj~ej =∑j,k

vjMjk~ek ,

da cuivi =

∑j

vjMji .

In forma matriciale questa relazione puo essere scritta come

Tv =T v ·M ,

dove T indica la trasposizione, mentre ′·′ e l’usuale prodotto matriciale. In conclusione

v =T M−1v ,

ovvero: se la base ~ei viene cambiata con la matrice M , allora le componenti di un vettoresi trasformano con l’inversa della matrice trasposta. In pratica si trasformano al contrarioper compensare il cambiamento di base in modo da lasciare invariato ~v. Questo giustificail termine controvariante. Se vogliamo identificare un vettore con le sue componenti, alloradobbiamo tenere presente che queste si trasformano controvariantemente rispetto ad un cam-biamento di riferimento. E chiaro che tali ragionamenti non dipendono dalla dimensione dellospazio vettoriale.Si cominci anche ad osservare una prima comodita della scelta sulle posizioni degli indici inalto o in basso: nel cambiamento di base, si somma l’indice in alto della matrice con quello inbasso della base, per dare una seconda base che ancora e indicizzata da un pedice. Ecco percheil corrispondente indice di riga della matrice e un pedice.Viceversa, nel cambiamento delle componenti, espresso dalla relazione vi =

∑j v

jMji, si somma

l’indice in basso della matrice con quello in alto delle componenti, per dare altre componentiche secondo le convenzioni scelte devono ancora avere l’indice in alto. Questo mostra la coeren-za delle convenzioni. Scegliamo infine di adottare una ulteriore semplificazione, suggerita daEinstein e nota appunto come convenzione di Einstein: ogni volta che un indice in alto eduno in basso compaiono ripetuti, e sottintesa una sommatoria sugli stessi. Per esempio potremoscrivere le relazioni precedenti come

~v = vi~ei ,~ei = Mij~ej , v

i = vjMji ,

e cosı via. In questa sezione d’ora in poi adotteremo questa convenzione.Mettiamo infine in evidenza il seguente fatto: quando si identifica un vettore con le sue com-ponenti, talvolta si dice erroneamente che il vettore e descritto da 3 (nel caso tridimensionle)scalari. Tuttavia uno scalare e una grandezza che non dipende dalla scelta del sistema diriferimento, come puo essere la temperatura in un punto dato. Questa osservazione dovrebbe

Page 15: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 15

ulteriormente chiarire la possibile ambiguita che puo portare l’identificazione di un vettore conle sue componenti. Se da una parte il formalismo in componenti ha un significato pratico, datoche esse rappresentano le quantita da misurare in un dato riferimento, d’altra parte si intu-isce la necessita di un formalismo indipendente dai riferimenti per catturare quelle proprietaintrinseche che prescindano dalla scelta di un riferimento.

1.2.2 Covettori, indici in basso e covarianza. I covettori sono gli elementi dello spazioduale V ∗. Indichiamo con w il generico covettore. Esso sara completamente specificato dallasua valutazione su una base ~ei di V : wi = w(~ei). Infatti possiamo scrivere w = wiε

i dove εi

e la base di V ∗ canonicamente associata alla base di V , come mostrato nelle sezioni precedenti.Ne segue immediatamente che le componenti wi di w si trasformano con la stessa matrice concui si effettua il cambiamento di base:

wi = w(Mij~ej) = Mi

jwj .

Ecco perche i covettori vengono detti vettori controvarianti, e secondo le convenzioni introdottele loro componenti si indicano con un pedice. Lasciamo come esercizio quello di verificare chein effetti la base canonica si trasforma con la matrice inversa trasposta, mostrando quindi lacompleta coerenza delle notazioni.Si noti anche che w(~v) = wiv

i.

1.2.3 Tensori in T nm(V ) e componenti. A questo punto e chiaro quale debba essere lanotazione in componenti di un tensore x ∈ T nm(V ). Scriveremo cioe le sue componenti comexi1...inj1...jm

tenendo conto che se si effettua un cambiamento di base

~ei = Mij~ej ,

le componenti diventano

xi1...inj1...jm= Mj1

k1 . . .Mjnkm(TM−1)i1h1

. . . (TM−1)inhnxh1...hnk1...km

.

Lasciamo come esercizio la dimostrazione di questo fatto, nonche la riformulazione in terminidi azione del gruppo GL(V ).

1.2.4 Una convenzione alternativa. In casi piu generali e conveniente utilizzare unanotazione leggermente differente da quella indicata nel paragrafo precedente, valida ad esempioin casi di spazi vettoriali su corpi non abeliani anziche su campi. In tal caso occorrera distingueread esempio tra campi vettoriali destri e campi vettoriali sinistri. Se K e il corpo degli scalari,posto s : (K, V )→ V , diremo che lo spazio vettoriale V e destro se

s(a, s(b, v)) = s(ba, v) , ∀a, b ∈ K , v ∈ V ,

mentre diremo che e sinistro se

s(a, s(b, v)) = s(ab, v) , ∀a, b ∈ K , v ∈ V ,

Page 16: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 16

cioe come se gli scalari moltiplicassero da destra, s(a, v) = va, nel primo caso e da sinistra,s(a, v) = av, nel secondo caso. Si noti che se uno spazio vettoriale e destro allora il suo duale V ∗

e uno spazio vettoriale1 sinistro e viceversa. Per fissare le idee, secondo le convenzioni comuni,supponiamo che V sia destro. Sia ~e1, . . . , ~en una base di V , che disporremo in un vettore-riga ~e := (~e1, . . . , ~en). Il generico vettore ~v ∈ V avra percio componenti in K che scriveremoconvenientemente in un vettore-colonna v ∈ Kn in modo da utilizzare il prodotto riga percolonna2 nella scrittura

~v =v∑i=1

~eivi = ~e · v .

Si verifica facilmente che, fissata la base ~e un endomorfismo lineare di V e rappresentato dauna matrice n× n con coefficienti in K, che moltiplica con l’usuale prodotto riga per colonna ivettori-colonna v che rappresentano i punti di V in Kn.Consideriamo ora il duale V ∗ e sia 〈 , 〉 : V ∗ × V → K la valutazione dei funzionali sui vettori,che trasforma in modo naturale l’azione destra degli scalari su V nell’azione a sinistra su V ∗. Sia~ε1, . . . ,~εn la base duale canonica definita da 〈~εi, ~ej〉 = δij, dove la delta di Kronecker e costruitacon lo zero e l’unita in K. Conviene allora disporre i vettori della base in un vettore-colonna

ε =

~ε1

.

.

.~εn

in modo che la definizione della base diventa 〈ε,~e〉 = I mentre ~e⊗ ε = idV , essendo I la matricedi componenti δij.Ne segue che nella base fissata un covettore ~v ∈ V ∗ sara individuato da un vettore riga v =(v1, . . . , vn) ∈ Kn in modo tale che ~v = v · ε. In particolare se ~v = v · ε ∈ V ∗ e ~w = ~e · w ∈ Vallora si ottiene 〈~v, ~w〉 = v · w, l’usuale prodotto riga per colonna! Sia inoltre A ∈ End(V ) edA∗ l’applicazione duale definita da 〈A∗~v, ~w〉 := 〈~v, A~w〉. Ne segue che se A e rappresentato dauna matrice M ∈Mat(n,K) tale che w 7→ ·w, allora A∗ e rappresentato dalla stessa matriceM che pero agisce a destra: v 7→ v ·M . Si noti che solo dopo trasposizione, che trasformai vettori riga in vettori colonna, l’operatore aggiunto viene allora rappresentato dalla matricetrasposta che pero agisce a sinistra. Questo perche essenzialmente la trasposizione corrispondeall’esplicitazione dell’isomorfismo (non naturale) tra V e V ∗ che quindi trasforma un’azionedestra in sinistra e viceversa. Tuttavia tale isomorfismo e conveniente solo nel caso degli spazivettoriali su un campo cosicche non vi e nessuna differenza tra azione destra ed azione sinistra.In generale invece e conveniente mantenere evidente la caratteristica di spazio sinistro per V ∗

(se V e destro) e cio giustifica le notazioni qui introdotte.In queste notazioni un cambiamento di base sara definito da una matrice M ∈ GL(n,K) tale

che ~e = ~e ·M . La condizione di indipendenza di un vettore dalla base e espressa dunque dalla

1qui continuiamo a limitarci al caso di spazi finito dimensionali e V ∗ e lo spazio dei funzionali lineari su Va valori in K

2che d’ora in poi indicheremo con un punto ’·’

Page 17: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 17

relazione ~v = ~e · v = ~e · ¯v ovvero

~e · ¯v = ~e · v = ~e · (M ·M−1) · v = (~e ·M) · (M−1 · v) = ~e · (M−1 · v) ,

cosicche ¯v = M−1 · v: se la base trasforma con la matrice M (a destra) allora le componentidel vettore trasformano con la matrice M−1 (a sinistra).Lasciamo come esercizio la determinazione di simili proposizioni nel caso dei covettori e deitensori in generale, nonche il confronto dettagliato con le formule ottenute nei paragrafi prece-denti.Mentre nel presente capitolo continueremo ad usare le notazioni precedenti, queste convenzioniverranno adottate nel capitolo 11 riguardante i fibrati differenziali.

1.2.5 Il tensore metrico e l’abbassamento ed innalzamento degli indici. Su uno spaziovettoriale V finitodimensionale e reale, e sempre possibile introdurre un tensore metrico, cioeuna forma bilineare non degenere g ∈ Bil(V, V ). Nondegenere significa che se fissiamo ~v ∈ V e

si ha che g(~v, ~w) = 0 , ∀ ~W ∈ V allora ~v = ~0. Se g(~v,~v) ≥ 0 , ∀~v ∈ V , si dice che la metricae definita positiva o Euclidea. Lasciamo come esercizio la verifica del fatto che in tal casog(~v,~v) = 0 implica ~v = ~0. Similmente una metrica g si dira definita negativa se −g e definitapositiva. Nei restanti casi si parlera di metrica Lorentziana con data segnatura. In ogni casovediamo che il tensore metrico e dunque un tensore simmetrico in V ∗ ⊗ V ∗.Esso definisce una corrispondenza biunivoca ψ : V → V ∗, ~v 7→ ψ(~v), dove ψ(~v)(~w) := g(~v, ~w).Si verifica immediatamente che si tratta infatti di un isomorfismo lineare, basti usare il fattoche g e nondegenere3. In componenti si ha

vi = gijvj ,

dove vi sono le componenti del covettore ψ(~v), notazione piuttosto naturale dato l’isomorfismo.Viceversa, dato un covettore w, si indicano con wi le componenti del vettore ψ−1(w). Se con gij

indichiamo le componenti della matrice inversa alla gij (si dimostri che gij sono le componentidi un tensore simmetrico controvariante di grado 2), allora si ha

wi = gijwj .

Le operazioni appena viste vengono anche chiamate abbassamento ed innalzamento dell’indice.Esse possono essere estese in maniera ovvia a tensori di rango qualunque. Cosı ad esempio

Tij = gikTkj = gjkTi

k = gikgjlTkl .

Si noti in generale l’importanza della posizione degli indici alzati ed abbassati: in generale T ije Tj

i, ad esempio, non saranno affatto uguali.Si noti infine che nel caso di una metrica euclidea e sempre possibile scegliere una base in cuigij = δij, essendo δij l’usuale simbolo di Kronecker.

1.2.6 Esempi di tensori in fisica. Abbiamo gia parlato di esempi di vettori in fisica, comela velocita, la forza, eccetera, che individuano tensori di tipo (1, 0). Cosı potremo anche dire

3In particolare dunque in generale tale isomorfismo non richiede nemmeno che g sia simmetrico.

Page 18: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 18

che una quantita scalare, come ad esempio la temperatura, e un tensore di tipo (0, 0). Pervedere come i tensori prolificano in fisica, vediamo ulteriori esempi di grandezze fisiche di natu-ra tensoriale.La costante dielettrica.Consideriamo una sostanza materiale immersa in un campo elettrico. Dal punto di vista micro-scopico accade che le molecole componenti il materiale subiranno l’effetto del campo elettricoeventualmente deformandosi ed orientandosi secondo le coercizioni imposte dal campo e dallastruttura stessa del materiale (cristallina o meno). Per contro, le molecole deformate genera-no allora un campo (microscopico) che si somma al campo esterno modificando cosı il campocomplessivo nella regione occupata dalla sostanza materiale.Dal punto di vista macroscopico cio verra descritto in termini di un campo di induzione elettrica~D che dipendera sia dal campo elettrico esterno ~E, sia dalla natura precisa della sostanza Sstessa

~D = E(~E,S) .

In particolare per alcune sostanze puo accadere che ~D0 := E(~0,S) sia sia differente da zero.Si dice allora che S e un materiale piezoelettrico. La maggior parte delle sostanze non sonopiezoelettriche sicche ~D0 = ~0. Per tali sostanze, se il campo elettrico nella regione in cui sonosituate e abbastanza debole, l’induzione elettrica dipendera linearmente dal campo ~E. Qualorale correzioni nonlineari non entrino in gioco praticamente mai la sostanza in considerazione vienedetta mezzo lineare o anche mezzo normale. I materiali per cui invece le correzioni nonlinearinon sono essenzialmente mai trascurabili si dicono mezzi nonlineari.Supponiamo dunque di disporre di un mezzo normale e concentriamoci su un punto fissato.In tal caso allora E definisce una mappa lineare E : R3 → R3 che, per quanto osservato nelparagrafo 1.1.9, sara rappresentata da un tensore ε ∈ V ∗ ⊗ V , detto tensore di permettivitadielettrica. Qui abbiamo posto R3 =: V . Poiche in generale tale tensore dipendera dal puntoconsiderato, in generale la permettivita dielettrica definisce in realta un campo tensoriale sulmezzo normale4. Se non si ha alcuna dipendenza dal punto, si dice che il mezzo normale e undielettrico omogeneo. In componenti potremo scrivere

Di = εijEj ,

dove ovunque e stata omessa la dipendenza esplicita dal punto p.Osserviamo che se gij sono le componenti della metrica spaziale (euclidea) nel dato punto p, al-lora si puo ivi descrivere la permeabilita dielettrica tramite il tensore completamente covarianteεij ottenuto abbassando l’indice controvariante. Si puo allora dimostrare, tramite un sempliceargomento di termodinamica, che quest ultimo tensore deve necessariamente essere simmetrico.Nel caso in cui il mezzo sia omogeneo allora il tensore ε non dipende dal punto. Se invece ilmezzo e isotropo le sue componenti non devono restare invariate qualunque sia la rotazione chesi compia nel cambiare riferimento. Poiche, a meno di costanti moltiplicative, l’unico tensorea due indici invariante per rotazione e δi

j, si ha che in tal caso deve essere εij = εδi

j. Se ilmezzo e anche omogeneo, il dielettrico e allora unicamente caratterizzato da uno scalare ε, detto

4Il concetto di campo tensoriale richiede l’introduzione di strumenti matematici piu raffinati e verra descrittoin maniera precisa nel capitolo successivo.

Page 19: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 19

costante dielettrica.Una trattazione del tutto analoga puo essere fatta per il campo magnetico.Il tensore degli sforzi e la pressione.Un altro esempio riguarda lo studio delle proprieta meccaniche dei mezzi continui. Se ad es-empio ci si accinge a deformare un corpo solido che si trovava all’equilibrio, esso si opporra atale azione tramite delle forze interne che tenderanno a mantenerlo (o riportarlo) nello stato diequilibrio. Tali forze interne vengono dette sforzi.Se il corpo solido preso in considerazione non e ad esempio fatto di materiale piezzoelettrico,cioe se le deformazioni non generano campi elettrici (o magnetici) macroscopici all’interno delmezzo, allora gli sforzi saranno dovuti univocamente alle inerazioni tra le molecole adiacenti.Dal punto di vista macroscopico, essendo tali interazioni di breve range, le varie parti del corposolido appariranno interagire solamente per mezzo delle superfici che li delimitano. Pertanto suuna porzione di volume V delimitato dalla superficie S = ∂V la forza esercitata dalle restantiparti del corpo sara esprimibile nella forma5

F i =

∮S

σijnjdS

essendo ~n(p) la normale uscente alla superficie S nel punto p. E’ chiaro che allora σij(p) e untensore di secondo grado definito in ogni punto p del corpo: esso e detto tensore degli sforzi.In particolare tramite il teorema di Stockes si puo interpretare la divergenza f i = ∂σij

∂xjcome

la forza per unita di volume subita dal corpo nel dato punto ad effetto della deformazione.Piu precisamente per definizione gli sforzi interni sono descritti dalla reazione del corpo alladeformazione, ovvero da −f i.Se xi rappresenta il vettore posizione del punto p rispetto ad un origine O, possiamo interpretarela quantita mij = f ixj−f jxi come il momento di torsione per unita di volume subito nel puntop a causa della deformazione6. Se si integra sul volume V esplicitando l’espressione di ~f eutilizzando nuovamente il teorema di Stockes, si ottiene un’espressione per il momento angolaretotale agente sul volume V dato

M ij =

∮S

(σikxj − σjkxi)nkdS +

∫V

(σij − σji)dV .

In generale accade che, benche abbiamo introdotto il concetto di forze volumetriche f i, talemomento debba essere ragionevolmente attribuito esclusivamente alle forze di contatto sullasuperficie, sicche l’integrale di volume deve essere nullo qualunque sia il volumetto considerato.Pertanto genericamente si ha che il tensore degli sforzi e un tensore simmetrico.Puo tuttavia accadere che in casi eccezionali il momento angolare subisca anche un contributodovuto ad esempio alla contorsione della struttura microscopica del mezzo. In questo caso laseconda equazione cardinale della meccanica non e piu conseguenza della prima e il termine divolume non e piu nullo. In questo caso il vettore

Si :=1

2εijkσ

jk ,

5si noti l’indice covariante per il versore ~n normale alla superficie: quando si calcola il flusso di un campo ~vvettoriale attraverso una superficie occorre determinare punto per punto il prodotto scalare ~v·~n = vinjgij = vinj

6per la precisione questo e il duale di Hodge del momento angolare, si veda piu avanti

Page 20: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 20

puo essere interpretato come uno spin classico del mezzo continuo. Benche si sia finora ra-gionato in termini di corpi solidi, gli stessi ragionamenti possono essere ripetuti, con le stesseconclusioni, nel caso di corpi fluidi (liquidi e gassosi). In effetti liquidi dotati di spin classicosono noti ai chimici industriali e vengono utilizzati ad esempio per la realizzazione di propellentiper razzi.Nel caso di mezzi isotropi, analogamente al tensore di permettivita dielettrica, il tensore deglisforzi dovra allora essere della forma σij = pδij. Il coefficiente di proporzionalita p e la pres-sione.Vettori assiali e vettori polari.Vi sono grandezze per la cui descrizione il concetto di vettore inteso intuitivamente come ogget-to descritto da una intensita, una direzione ed un verso e solo convenzionale e viene a dipenderenei dettagli dall’osservatore. Per chiarire questo punto consideriamo ad esempio il caso immag-inario di una sferetta che ruota su se stessa con velocita angolare ω. Supponiamo di volerattribuire un vettore alla velocita angolare, che ne specifichi sia l’asse di rotazione che il sensodi rotazione. Per stabilire tale vettore specifichiamo un sistema di riferimento cartesiano in-erziale sinistrorso con origine nel centro della sfera ed asse z sovrapposto all’asse di rotazione.Decidiamo dunque di attribuire alla velocita angolare il vettore di coordinate (0, 0, ω) se larotazione va dall’asse x all’asse y e con segno opposto nel caso contrario. Questo stabilira unben preciso vettore che secondo il nostro riferimento (~e1, ~e2, ~e3) si scrivera ~ω = ω~e3. Si noti cheil risultato per ~ω non dipende da quale dei due poli della sfera sia scelto come punto di uscitadell’asse z.Supponiamo ora di voler risolvere lo stesso problema con le stesse convenzioni ma scegliendostavolta un sistema (~e′x, ~e

′y, ~e′z) destrorso anziche uno sinistrorso. Il risultato ovvio e che deter-

mineremo un vettore ~ω′ = −~ω. E chiaro che nessuna delle due determinazioni e privilegiataed entrambi i vettori vanno ugualmente bene per specificare la velocita angolare della sferetta.Ciascuno di essi e ben definito una volta che si specifichi un sistema di riferimento orientato enon dipende dal sistema di riferimento purche si considerino solo riferimenti con lo stesso orien-tamento. Per dare un significato assoluto (cioe completamente indipendente dal riferimento) alvettore velocita angolare, e necessario unificare le due convenzioni, richiedendo che ω si trasfor-mi in ω′ quando si passi da un sistema sinistrorso ad uno destrorso. Cio significa che ~ω nonpuo essere trattato come un usuale vettore ma piuttosto occorre considerare la coppia ~ω ,Ω,Ω essendo l’orientamento scelto. I vettori con questa proprita si chiamano vettori assiali perdistinguerli dagli usuali vettori che vengono invece chiamati vettori polari.Si lascia come esercizio la verifica del fatto che il prodotto vettoriale tra due vettori polari e unvettore polare, mentre quello tra un vettore assiale ed uno polare e invece un vettore polare. Inparticolare si ha dunque che il campo elettrico puo essere rappresentato da un vettore polarementre quello magnetico sara un vettore assiale.Tensori rispetto ad un gruppo di trasformazioni.L’argomento del precedente esempio suggerisce una generalizzazione molto utile in fisica. Pos-siamo infatti dire che i vettori assiali si comportano come usuali tensori controvarianti di grado1 se consideriamo solo trasformazioni di riferimento che conservano l’orientamento. Piu ingenerale possiamo pensare a tensori che si comportano come tali solamente se si prende in con-siderazione un determinato gruppo G di trasformazioni. Sia cioe V uno spazio vettoriale che

Page 21: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 21

sia lo spazio supporto di una rappresentazione ρ del gruppo G.7 Diremo allora che Ti1,...,imj1,...,jn

sono le componenti di un tensore di tipo (m,n) rispetto al gruppo G (nella rappresentazione ρ)se trasformano nel modo corretto sotto una trasformazione di base indotta dalle applicazionilineari del tipo ρ(g) : V → V , al variare di g ∈ G.Per capire l’importanza di questo concetto in fisica vediamo alcuni esempi.Un primo semplice esempio e il vettore velocita che si comporta esattamente come un vet-tore rispetto al gruppo delle rotazioni ma non certamente rispetto al gruppo di trasformazionidi Galilei. I vettori forza ed accelerazione restano tali anche rispetto al gruppo di Galilei,mentre non lo sono rispetto al gruppo di Lorentz: rispetto ad esso si comportano solamentecome componenti spaziali di un tetravettore. In generale i tetravettori si comportano come talirispetto a trasformazioni tra sistemi di riferimento inerziali. Ad esempio la tetra-accelerazionenon trasforma correttamente se si passa da un sistema inerziale ad uno non inerziale. I campielettrico e magnetico si comportano come vettori (polare ed assiale) rispetto al gruppo dellerotazioni mentre rispetto al gruppo di Lorentz si comportano come le componenti di un tensoreantisimmetrico controvariante di secondo grado (il tensore di Faraday).Questi esempi e molti altri mostrano che in fisica e sovente indispensabile specificare il gruppodi trasformazioni rispetto al quale le grandezze in gioco si comportano effettivamente come ten-sori. Il carattere tensoriale di una grandezza fisica dipende in tal senso dal contesto specifico.Leggi tensoriali in fisica.Osserviamo per concludere quale sia l’importanza di formulare le leggi fisiche sotto forma ten-soriale. Il punto chiave e che se le componenti di un tensore sono nulle in un determinatoriferimento, allora lo sono in qualunque riferimento. Quindi se e possibile scrivere una leggefisica nella forma

Ti1,...,imj1,...,jn = 0 ,

in un dato riferimento, allora essa e universale nel senso che mantiene la stessa forma inqualunque altro sistema di riferimento. Cio e conseguenza del fatto che se Ti1,...,im

j1,...,jn sono lecomponenti del tensore T , il quale non dipende dalle coordinate, allora la legge fisica assumela forma T = 0, chiaramente indipendente dalla scelta di ogni sistema di riferimento. Cosıad esempio la legge di Newton F i = mai ha la forma invariante ~F = m~a che ne evidenziala natura tensoriale rispetto al gruppo di Galilei. Tale legge non e pero invariante rispetto algruppo di Lorentz, mentre lo sono le equazioni di Maxwell. In una descrizione coerente dellafisica e opportuno che le leggi fisiche siano tutte della stessa natura, cosicche diventa necessariomodificare le equazioni di Newton affinche possano essere anch’esse scritte in termini di tensoriLorentziani. Naturalmente si potrebbe pensare invece che sia necessario cambiare le equazionidi Maxwell per renderle Galilei-covarianti. Tuttavia la prima soluzione risulta essere quellacorretta, anzitutto dal punto di vista sperimentale. Vi sono inoltre degli evidenti motivi diprincipio che portano alla stessa conclusione: essendo i sistemi galileiani una situazione limitedi quelli lorentziani e piu naturale pensare che i tensori rispetto al gruppo di Galilei compaianosolo in tali situazioni limite.

7si veda il capitolo dedicato ai gruppi di Lie

Page 22: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 22

1.3 L’algebra esterna.

1.3.1 Il prodotto esterno. Sia V uno spazio vettoriale reale di dimensione n. Definiamo unsottospazio I2 di V ⊗ V con:

I2 := 〈v ⊗ v : v ∈ V 〉.

Si noti che per u, v ∈ V :

(u+ v)⊗ (u+ v) = u⊗ u+ v ⊗ v + u⊗ v + v ⊗ u,

quindi u⊗ v + v ⊗ u = (u+ v)⊗ (u+ v)− u⊗ u− v ⊗ v ∈ I2 per ogni u, v ∈ I2.Il prodotto esterno di V e lo spazio quoziente

∧2V := V ⊗ V/I2 con u ∧ v := u⊗ v = u⊗ v + I2.

Visto che v ⊗ v ∈ I2, si ha v ⊗ v + I2 = I2, quindi

v ∧ v = 0, u ∧ v = −v ∧ u

perche u⊗ v + v ⊗ u ∈ I2.Se ei e una base di V e u =

∑uiei, v =

∑vjej, allora:

u ∧ v = (∑

uiei) ∧ (∑

vjej) =∑

uivj(ei ∧ ej) =∑

1≤i<j≤n

(uivj − ujvi)(ei ∧ ej).

quindi gli ei ∧ ej con i < j generano ∧2V . Per vedere se sono indipendenti, definiamo per gliinteri a, b con 1 ≤ a < b ≤ n un’applicazione bilineare

φa,b : V × V −→ R, (u, v) 7−→ uavb − ubva.

Quindi φa,b definisce un’applicazione lineare φa,b : V ⊗ V → R. Si noti che φa,b(v ⊗ v) =vavb − vbva = 0, quindi φa,b(I2) = 0. Percio φa,b definisce un’applicazione lineare

φa,b : ∧2V −→ R, φa,b(u ∧ v) = uavb − ubva.

Siccome φa,b(ei ∧ ej) = 0 tranne se i, j = a, b segue che gli ei ∧ ej, i < j sono una base di∧2V , quindi

dim∧2V = (n2 ) = n(n− 1)/2, ∧2V = ⊕i<jRei ∧ ej.

In modo simile a quanto visto in 1.1.7, si puo considere applicazioni bilineari alternanti, cioeapplicazioni bilineari

φ : V × V −→ R, t.c. φ(u, v) = −φ(v, u) (u, v ∈ V ).

Si mostra che Hom(V ∧ V,R) = Bilalt(V × V,R) (c.f. 1.1.8) dove Bilalt(V × V,R) e lo spaziovettoriale reale delle applicazioni bilineari alternanti. Per esempio, φa,b ∈ Bilalt(V × V,R) qui

sopra corrisponde a φa,b ∈ Hom(V ∧ V,R).

Page 23: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 23

Finalmente osserviamo che per u = (u1, u2), v = (v1, v2) ∈ R2 si ha:

u ∧ v =

(u1

u2

)∧(v1

v2

)= det(u, v)e1 ∧ e2, dove (u, v) :=

(u1 v1

u2 v2

).

1.3.2 Il k-esimo prodotto esterno. Per ogni intero k ≥ 3 definiamo il sottospazio Ik diT k(V ) nel modo seguente:

Ik = Ik−1 ⊗ V ⊕ V ⊗ Ik−1 (⊂ T k(V )).

In particolare, per k = 3 si ha:

I3 = 〈u⊗ u⊗ v, u⊗ v ⊗ v : u, v ∈ V 〉.

In generale, se un tensore puro t = v1 ⊗ v2 ⊗ . . .⊗ vk ∈ T k(V ) soddisfa vi = vi+1 per un certoi, allora t ∈ Ik.

Il k-esimo prodotto esterno di V e lo spazio vettoriale

∧kV := T k(V )/Ik, v1 ∧ v2 ∧ . . . ∧ vk := v1 ⊗ v2 ⊗ . . .⊗ vk + Ik.

Poiche v1 ∧ v2 ∧ . . . ∧ vi ∧ vi+1 ∧ . . . vk = 0 se vi = vi+1 troviamo, come in 1.3.1, che

v1 ∧ v2 ∧ . . . ∧ vi ∧ vi+1 ∧ . . . ∧ vk = −v1 ∧ v2 ∧ . . . ∧ vi+1 ∧ vi ∧ . . . ∧ vk

per ogni vi ∈ V . Ogni permutazione di 1, . . . , n e un prodotto di trasposizioni del tipo(i i+ 1), quindi otteniamo che:

v1 ∧ v2 ∧ . . . ∧ vi ∧ vi+1 ∧ . . . ∧ vk = ε(σ)vσ(1) ∧ vσ(2) ∧ . . . ∧ vσ(i) ∧ vσ(i+1) ∧ . . . ∧ vσ(k)

per ogni σ ∈ Sk, dove Sk e il gruppo simmetrico, e ogni vi ∈ V , dove ε(σ) e il segno dellapermutazione σ.

Sfruttando il fatto che applicazioni multilineari in k variabili, cioe lineari in ogni variabile,ed alternanti, cioe :

φ : V k −→ R, φ(v1, . . . , vi, . . . , vk) = ε(σ)φ(vσ(1), . . . , vσ(i), . . . , vσ(k))

definiscono applicazioni ∧kV −→ R si mostra che una base di ∧kV e data dagli:

eI := ei1 ∧ ei2 ∧ . . . ∧ eik , dove I = i1, . . . , ik ⊂ 1, . . . , n

e i1 < i2 < . . . < ik. In particolare

dim∧kV = (nk) se 0 ≤ k ≤ n, ∧kV = 0 se k > n.

Se dimV = n si ha, usando il fatto che il determinante di una matrice e R-lineare in ognicolonna ed e alternante, che

v1 ∧ v2 ∧ . . . ∧ vn = det(v1, . . . , vn)(e1 ∧ e2 ∧ . . . ∧ en),

Page 24: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 24

dove ei e una base di V e

(v1, . . . , vn) =

(v1)1 (v2)1 . . . (vn)1

(v1)2 (v2)2 . . . (vn)2...

......

...(v1)n (v2)n . . . (vn)n

dove vj =n∑i=1

(vj)iei.

1.3.3 L’algebra esterna. Per uno spazio vettoriale reale V di dimensione finita definiamo

T (V ) = ⊕∞k=0Tk(V )

dove T k(V ) e definito in 1.1.13. Lo spazio vettoriale T (V ), di dimensione infinita se V 6= 0,ha un prodotto naturale (anche se ‘banale’). Per tensori ‘puri’ si definisce:

(u1⊗u2⊗ . . .⊗uk) · (v1⊗ v2⊗ . . .⊗ vl) := u1⊗u2⊗ . . .⊗uk⊗ v1⊗ v2⊗ . . .⊗ vl (∈ T k+l(V )).

Si estende poi questo prodotto in modo R-bilineare a tutto T (V ). Quindi se s =∑λisi, t =∑

µjtj ∈ T (V ) con si, tj tensori puri, definiamo

s · t = (∑

λisi) · (∑

µjtj) =∑

uivj(si · tj).

Con questo prodotto T (V ) diventa una R-algebra, cioe uno spazio vettoriale reale con unprodotto R-bilineare. Sia

I = I2 ⊕ I3 ⊕ . . .⊕ Ik ⊕ . . . = ⊕∞i=kIk,

con Ik come in 1.3.2. Allora lo sottospazio reale I e un ideale bilaterale dell’algebra T (V ), cioeper t ∈ T (V ) e s ∈ I si ha s · t ∈ I e t · s ∈ I, come segue facilmente dalla definizione di Ik.Questo implica che l’algebra quoziente, chiamata l’algebra esterna,

∧V := T (V )/I = R⊕ V ⊕ ∧2V ⊕ . . .⊕ ∧nV,

e una R-algebra con prodotto indotto da ‘·’. Tale prodotto si indica con ∧:

(u1 ∧ u2 ∧ . . . ∧ uk) ∧ (v1 ∧ v2 ∧ . . . ∧ vl) := u1 ∧ u2 ∧ . . . ∧ uk ∧ v1 ∧ v2 ∧ . . . ∧ vl (∈ ∧k+lV ).

Si verifica che:

(u1 ∧ u2 ∧ . . . ∧ uk) ∧ (v1 ∧ v2 ∧ . . . ∧ vl) = (−1)kl(v1 ∧ v2 ∧ . . . ∧ vl) ∧ (u1 ∧ u2 ∧ . . . ∧ uk).

1.3.4 L’azione di GL(V ) su ∧kV . Sia A ∈ GL(V ), allora abbiamo definito in 1.1.13

ρk(A) : V ⊗k −→ V ⊗k, x1 ⊗ . . .⊗ xk 7−→ (Ax1)⊗ . . .⊗ (Axk).

Page 25: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 25

Si noti che ρn(A)(Ik) = Ik, perche se xi = xi+1 anche Axi = Axi+1. Quindi ρn(A) induce unamappa lineare ‘ben definita’

ρ[k](A) : ∧kV −→ ∧kV, x1 ∧ . . . ∧ xk 7−→ (Ax1) ∧ . . . ∧ (Axk).

Poiche ρk e un omomorfismo, otteniamo, per ogni k, un omomorfismo

ρ[k] : GL(V ) −→ GL(∧kV ), ρ[k](AB) = ρ[k](A)ρ[k](B).

Si verifica che se n = dimV allora ρ[n](A) = det(A).

1.3.5 Il duale di ∧kV . Ci sono due modi comodi per descrivere lo spazio vettoriale (∧kV )∗,lo spazio duale di ∧kV .

Dato l1, . . . , lk ∈ V ∗ e v1, . . . , vk ∈ V , definiamo un’applicazione multilineare

a : V ∗ × . . .× V ∗ × V × . . .× V −→ R, (l1, . . . , lk, v1, . . . , vk) 7−→ det(A), A = (li(vj)),

cioe A e la matrice k × k con coefficienti i numeri reali Aij := li(vj). La multilinearita di apermette di definire un’applicazione bilineare

a′ : (V ∗)⊗k × V ⊗k −→ R, a′(l1 ⊗ . . .⊗ lk, v1 ⊗ . . .⊗ vk) = a(l1, . . . , lk, v1, . . . , vk).

Si noti che a′(l1⊗. . .⊗lk, v1⊗. . .⊗vk) = 0 se vi = vi+1 (in tal caso due colonne di A sono uguali)e anche se li = li+1 (in tal caso due righe di A sono uguali). Quindi a′ e zero su Ik ⊂ V ⊗k e suI∗k ⊂ (V ∗)⊗k (definito in modo analogo). Quindi a′ definisce un’applicazione bilineare:

a : ∧k(V ∗) × ∧kV −→ R, a(l1 ∧ . . . ∧ lk, v1 ∧ . . . ∧ vk) = a(l1, . . . , lk, v1, . . . , vk).

Si scrive di solito (l1 ∧ . . . ∧ lk)(v1 ∧ . . . ∧ vk) := a(l1, . . . , lk, v1, . . . , vk), in modo esplicito:

(l1 ∧ . . . ∧ lk)(v1 ∧ . . . ∧ vk) =∑σ∈Sk

ε(σ)l1(vσ(1))l2(vσ(2)) · . . . · lk(vσ(k))

dove Sk e il gruppo simmetrico e ε(σ) e il segno della permutazione σ ∈ Sk.Sia e1, . . . , en una base di V e sia ε1, . . . εn la base duale di V ∗. Allora gli eI = ei1 ∧ . . .∧ eik

sono una base di ∧kV e gli εJ = εj1 ∧ . . . ∧ εjk sono una base di ∧k(V ∗). Si ha:

εJ(eI) =

1 se I = J,0 se I 6= J,

perche la matrice εjk(eil) e l’identita I se I = J ; se I 6= J esiste un ia ∈ I, ia 6∈ J e quindiεjk(eia) = 0 per ogni jk ∈ J e percio det(εjk(eil)) = 0. Questo mostra che le applicazioni lineariεJ : ∧kV → R sono la base duale della base data dalle eI , e quindi

∧k(V ∗)∼=−→ (∧kV )∗, l1 ∧ . . . ∧ lk 7−→ [v1 ∧ . . . ∧ vk 7−→ (l1 ∧ . . . ∧ lk)(v1 ∧ . . . ∧ vk)].

Page 26: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 26

Un’altro modo per ottenere lo spazio (∧kV )∗ e il seguente. Lo spazio vettoriale ∧nV e unodimensionale. Si scelga un isomorfismo f : ∧nV → R. Allora si ha un isomorfismo

∧n−kV∼=−→ (∧kV )∗, u1∧ . . .∧un−k 7−→ [v1∧ . . .∧ vk 7−→ f(u1∧ . . .∧un−k ∧ v1∧ . . .∧ vk)].

Si noti che se J ⊂ 1, . . . , n e il complemento di I = i1, . . . , ik, allora eJ ∈ ∧n−kV soddisfaeJ ∧ eI = ±e1 ∧ . . . ∧ en 6= 0 ∈ ∧nV ; mentre se I e J hanno un elemento in comune si haeJ ∧ eI = 0. Quindi, a meno di moltiplicazione per scalari, gli eJ , con |J | = n− k, sono la baseduale della base di ∧kV data dalle eI con |I| = k.

1.3.6 Orientazione. Sia V uno spazio vettoriale reale di dimensione n. Lo spazio vettoriale∧nV e unidimensionale, quindi isomorfo a R, e percio (∧nV )−0 ha due componenti connesse.Un’orientazione su V e la scelta di una componente connessa di (∧nV )−0. Una base ei di Ve detta orientata se e1∧ . . .∧en e un elemento nella componente connessa data dall’orientazione.

Per esempio, se ei e la base standard di V = Rn, un’orientazione di V e data dalla com-ponente connessa a cui appartiene e1 ∧ . . . ∧ en. La base e2, e1, e3, . . . , en di V e allora nonorientata in quanto e2 ∧ e1 ∧ e3 ∧ . . .∧ en = −e1 ∧ . . .∧ en non giace nella componente connessadeterminata dall’orientazione.

1.3.7 L’operatore di Hodge. Sia V uno spazio vettoriale reale orientato di dimensione ndotato di un prodotto scalare (, ). Definiamo un’ applicazione lineare, chiamata operatore diHodge:

∗ : ∧kV −→ ∧n−kV, ∗eI = εI,JeJ ,

dove e1, . . . en e una base ortonormale orientata di V , I = i1, . . . , ik, J = j1, . . . , jn−k eI ∪ J = 1, . . . , n, ed εI,J ∈ ±1 e tale che

εI,J(eI ∧ eJ) = εI,J(ei1 ∧ . . . ∧ eik) ∧ (ej1 ∧ . . . ∧ ejn−k) = e1 ∧ . . . ∧ en.

Si puo mostrare che ∗ non dipende dalle scelta della base ortonormale orientata. La mappa ∗e un isomorfismo per ogni k, 0 ≤ k ≤ n.

Per esempio, se definiamo un’orientazione su R3 con la scelta della componente connessasulla quale giace e1∧e2∧e3, dove ei e la base standard, e prendiamo il prodotto scalare standard,allora otteniamo per ∗ : ∧2R3 → ∧1R3 = R3:

∗(e1 ∧ e2) = e3, ∗(e1 ∧ e3) = −e2, ∗(e2 ∧ e3) = e1,

(si noti: (e1 ∧ e3) ∧ e2 = −e1 ∧ e2 ∧ e3, cioe ε1,3,2 = −1, quindi ∗(e1 ∧ e3) = −e2).Per x = (x1, x2, x3), y = (y1, y2, y3) ∈ R3 si ha:

x ∧ y = (x1y2 − x2y1)(e1 ∧ e2) + (x1y3 − x3y1)(e1 ∧ e3) + (x2y3 − x3y2)(e2 ∧ e3),

quindi∗(x ∧ y) = (x2y3 − x3y2)e1 − (x1y3 − x3y1)e2 + (x1y2 − x2y1)e3 = x× y,

dove x× y e il prodotto vettoriale.Il caso Minkowskiano.

Page 27: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

1 ALGEBRA MULTILINEARE 27

In alcune applicazioni fisiche lo spazio vettoriale non e dotato di un prodotto scalare ma sola-mente di una forma simmetrica non degenere η di segnatura non definita. Un tipico esempio elo spazio-tempo minkowskiano. E possibile ugualmente definire il duale di Hodge in base allaseguente osservazione. La forma η, essendo non degenere, induce un isomorfismo naturale8 traV e il suo duale V ∗:

η : V −→ V ∗ v 7−→ η(v); η(v)[w] = η(v, w) , ∀w ∈ V .

Tale isomorfismo si estende in modo ovvio ad un isomorfismo Λη tra ΛV e ΛV ∗, con(∧kη)(w1, . . . , wk) = η(w1) ∧ . . . ∧ η(wk).Essendo η simmetrica e non degenere, essa avra un numero p si autovalori positivi ed un numeroq di autovalori negativi, tali che p+ q = n := dim(V ). Si dice che la forma ha segnatura (p, q)o anche che la segnatura e s = p− q. Una base eini=1 ⊂ V si dice ortonormale se

η(ei, ej) =

0 se i 6= j1 se i = j ≤ p−1 se i = j > p .

Fissata una base ortonormale orientata eini=1, sia ε ∈ ΛnV ∗ l’unico elemento individuatoda ε(e1, . . . , en) = 1. Si dimostra che non dipende dalla scelta della base. Esso genera degliisomorfismi lineari

ε(k) : ΛkV −→ Λn−kV ∗ , v1 ∧ . . . ∧ vk 7→ ε(k)(v1 ∧ . . . ∧ vk) , ∀v1, . . . , vk ∈ V ,

doveε(k)(v1 ∧ . . . ∧ vk)[w1, . . . , wn−k] := ε(v1 . . . vk, w1, . . . , wn−k) .

Otteniamo allora un operatore ∗ : ΛkV → Λn−kV definito da ∗ = (∧n−kη)−1 ε(k). Tale mappacoincide con l’operatore di Hodge se η e definita positiva e ne costituisce la definizione nel casoin cui η sia semplicemente nondegenere. Si noti che ∗∗ = (−1)qid.Si noti infine che η induce una forma bilineare nondegenere su V ∗ che si puo usare per definireil duale di Hodge per ΛV ∗. Si ottiene facilmente che sul duale ∗ = ε(k) ∧kη (esercizio).

8cioe indipendente dalla scelta di una base

Page 28: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 28

2 Rappresentazioni di gruppi finiti

Testi consigliati: [A], [FH], [S].

2.1 Teoria generale

2.1.1 Rappresentazioni e applicazioni equivarianti. Sia G un gruppo finito, sia V unospazio vettoriale reale (o complesso) di dimensione finita e sia

ρ : G −→ GL(V )

un omomorfismo. Un tale omomorfismo e detto rappresentazione di G in V .Siano ρ : G → GL(V ) e τ : G → GL(W ) due rappresentazioni di un gruppo G sugli spazi

vettoriali complessi V,W . Un’applicazione lineare f : V → W e detta G-equivariante (oppureG-invariante, vedi 2.2.3) se f(ρ(g)v) = τ(g)f(v) per ogni g ∈ G e v ∈ V . Si scrive:

HomG(V,W ) = f ∈ Hom(V,W ) : f(ρ(g)v) = τ(g)f(v) ∀g ∈ G, v ∈ V .

Le rappresentazioni ρ e τ sono dette isomorfe (oppure equivalenti) se esiste una f ∈HomG(V,W ) che e un ismorfismo f : V → W di spazi vettoriali. In tale caso si ha:fρ(g) = τ(g)f , cioe fρ(g)f−1 = τ(g) per ogni g ∈ G.

In particolare, se S : V → V e un’applicazione lineare invertibile, e se ρ : G→ GL(V ) e unarappresentazione, allora τ : G→ GL(V ), definita da τ(g) := Sρ(g)S−1 e una rappresentazioneisomorfa a ρ.

2.1.2 Sottospazi invarianti. Un sottospazio W ⊂ V e detto G-invariante se ρ(g)(W ) ⊂ Wper ogni g ∈ G.

Una rappresentazione ρ di G in V , V 6= 0, e detta irriducibile se non ci sono sottospaziG-invarianti diversi da W = 0 e W = V .

Un risultato fondamentale e:

2.1.3 Teorema. Sia ρ una rappresentazione di un gruppo finito G in V , allora V e una sommadiretta di sottorappresentazioni irriducibili.

2.1.4 Prodotti scalari invarianti. Per la dimostrazione del teorema, vedi per esempio [A],Corollario (4.9) del Capitolo 9. Si mostra prima che esiste su V un prodotto scalare invarianteper G, cioe (x, y) = (ρ(g)x, ρ(g)y) per ogni x, y ∈ V e g ∈ G. Dato questo, segue facilmenteche se W ⊂ V e G-invariante, allora anche W⊥ e G-invariante e il teorema segue.

Il fatto che ogni ρ(g) preserva un prodotto scalare, cioe che ρ(g) e unitario, implica che ρ(g)e diagonalizzabile.

E interessante notare che un prodotto scalare G-invariante esiste piu in generale se G e ungruppo di Lie compatto. Il trucco di unitarieta Weyl (Weyl’s unitarity trick), che si usa permostrare la completa riducibilita di rappresentazioni di gruppi e algebre di Lie semisemplici,sfrutta tale costruzione.

Page 29: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 29

2.1.5 Esempio. Sia G = S2 il gruppo delle permutazioni di due elementi. Unarappresentazione ρ di G su uno spazio vettoriale V si decompone in G-rappresentazioni

V = V1 ⊕ Vε, V1 = v ∈ V : ρ(g)v = v ∀g ∈ G, Vε = v ∈ V : ρ((12))v = −v ,

infatti ogni v ∈ V si scrive come v = (v + ρ(12)v)/2 + (v − ρ(12)v)/2.Ogni sottospazio di V1 (e di Vε) e G-invariante. Invece, se x ∈ V1, y ∈ Vε sono entrambi

non nulli, allora 〈x + y〉 non e una sottorappresentazione, perche ρ((12))(x + y) = x − y ex − y 6∈ 〈x + y〉. Ogni sottospazio 1-dimensionale di V1 (e di Vε) e una rappresentazioneirriducibile di G. Si noti che, a meno di isomorfismi, G ha soltanto due rappresentazioniirriducibili, entrambe hanno dimensione 1 e una e banale (ρ(g) = 1 per ogni g ∈ G), mentreper l’altra si ha ρ(e) = 1, ρ((12)) = −1, quindi coincide con il segno ε : S2 → ±1 ⊂ GL(C).

2.1.6 Esempio. Sia G = Sm e sia V = Rm. Si definisce una rappresentazione di G in Vponendo

ρ : G −→ GL(V ), ei 7−→ eσ(i),

dove e1, . . . , em e la base standard di Rm. Il sottospazio

W = 〈e1 + e2 + . . .+ em〉

e G-invariante perche gli ei sono permutati tra di loro da ogni g ∈ G. La rappresentazione diG su W e banale e, poiche dimW = 1, W e una rappresentazione irriducibile di G.

Sia (·, ·) il prodotto scalare standard su Rm, allora e facile vedere che (ρ(g)x, ρ(g)y) = (x, y)per ogni g ∈ G e x, y ∈ V . Quindi questo prodotto scalare e G-invariante e percio W⊥ e unsottospazio G-invariante.

2.1.7 Il Lemma di Schur. Il seguente lemma e uno strumento fondamentale per lo studiodelle rappresentazioni.

2.1.8 Lemma (Lemma di Schur.) Siano ρ : G → GL(V ) e τ : G → GL(W ) due rappresen-tazioni irriducibili di un gruppo G su spazi vettoriali complessi V,W . Sia f ∈ HomG(V,W ),cioe f e un’applicazione G-equivariante. Allora

1. f = 0 oppure f e un isomorfismo,

2. se V = W e ρ = τ , allora f = λI, la moltiplicazione per uno scalare λ.

Dimostrazione. Si noti che ker(f) e im(f) sono sottospazi G-invarianti di V e di W rispetti-vamente. Infatti, se v ∈ ker(f), cioe f(v) = 0, allora τ(g)f(v) = 0 e quindi f(ρ(g)v) = 0, percioanche ρ(g)v ∈ ker(f). Similmente, se w ∈ im(f), allora w = f(v) per un certo v ∈ V e quindiτ(g)w = τ(g)f(v) = f(ρ(g)v), cioe τ(g)w e l’immagine di ρ(g)v ∈ V e percio τ(g)w ∈ im(f).

Poiche V e irriducibile, si ha ker(f) = V oppure ker(f) = 0. Nel primo caso f e zero.Nel secondo caso, f e iniettiva e V ∼= im(f) e un sottospazio G-invariante, non-zero, di W , chee irriducibile, quindi im(f) = W e percio f e anche suriettiva. Segue che f e un isomorfismo.

Page 30: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 30

Sia V = W e ρ = τ . L’applicazione f : V → V e lineare, sia λ ∈ C un autovalore di f .Allora f − λI e un endomorfismo di V che e G-equivariante perche f lo e e (λI)A = A(λI) perogni applicazione lineare A : V → V , in particolare per A = ρ(g). Quindi ker(f − λI) e unsottospazio G-invariante non nullo e percio ker(f − λI) = V . Segue che f = λI. 2

2.2 Caratteri

2.2.1 Il carattere di una rappresentazione. Sia ρ : G→ GL(V ) una rappresentazione diG. Definiamo un’applicazione, il carattere di ρ,

χ = χρ : G −→ C, χ(g) := Tr(ρ(g))

dove Tr(A) e la traccia dell’applicazione lineare A : V → V (cioe, se A e data da una matrice(aij), allora Tr(A) =

∑i aii).

Si noti che se τ : G → GL(V ) e una rappresentazione e A ∈ GL(V ) e un isomorfismo traρ e τ , cioe A(ρ(g)v) = τ(g)Av per ogni v ∈ V , allora τ(g) = Aρ(g)A−1 e quindi χρ = χτ . Ilcarattere dipende quindi soltanto della classe di isomorfismo di una rappresentazione.

Alcune proprieta di base di un carattere sono:

2.2.2 Lemma. Sia ρ : G→ GL(V ) una rappresentazione di un gruppo finito G con carattereχ = χρ. Allora:

1. χ(e) = dimV , dove e ∈ G e l’elemento neutro.

2. χ(g) = χ(hgh−1) per ogni g, h ∈ G, cioe, χ e costante sulle classi di coniugio di G.

3. χ(g−1) = χ(g), il coniugato complesso.

4. Se τ : G → GL(W ) e una rappresentazione, allora il carattere della rappresentazioneρ⊕ τ : G→ V ⊕W e χρ + χτ . Il carattere della rappresentazione ρ⊗ τ : G→ V ⊗W eχρχτ .

Dimostrazione. Poiche ρ(e) = I, la matrice identita n × n dove n = dimV , segueχ(e) = Tr(I) = n. La seconda proprieta segue da ρ(hgh−1) = ρ(h)ρ(g)ρ(h)−1 e il fatto cheTr(SAS−1) = Tr(A). Per mostrare la terza proprieta, consideriamo una base di V rispetto allequale ρ(g) e diagonale. Poiche G e finito si ha gN = e per un certo N . Percio ρ(g)N = I econ un semplice ragionamento si vede che gli autovalori λ1, . . . , λn di ρ(g) sono radici dell’unitaN -esime: λNi = 1 per i = 1, . . . , n e quindi λ−1

i = λi. Gli autovalori di ρ(g−1) = ρ(g)−1 sonoallora λ−1

i = λi. Percio

χ(g−1) = Tr(ρ(g)−1) = λ−11 + . . .+ λ−1

n = λ1 + . . .+ λn = χ(g).

L’ultima proprieta segue considerando delle basi ei, fj di V , W su cui ρ(g) e τ(g) sono dati damatrici diagonali (vedi 2.1.4). Se ρ(g)ei = λiei, ρ(g)fj = µjfj allora ei⊗ fj 7→ λiµj(ei⊗ fj). La

Page 31: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 31

traccia di ρ(g)⊗ τ(g) e allora

χρ⊗τ (g) = Tr(ρ(g)⊗ τ(g)) =∑i,j

λiµj = (∑i

λi)(∑j

µj) = χρ(g)χτ (g).

Il caso ρ⊕ τ e piu semplice. 2

2.2.3 Applicazioni equivarianti e invarianti. Si ricordi che Hom(V,W ) ∼= V ∗ ⊗W doveV ∗ = HomC(V,C) e lo spazio duale dello spazio vettoriale complesso V . La rappresentazioneρ su V definisce una rappresentazione duale ρ∗ su V ∗ data da ρ∗(g)l = l ρ(g)−1 = l ρ(g−1).Rispetto ad una base si ha ρ∗(g) = tρ(g)−1 = tρ(g−1). Poiche Tr(A) = Tr(tA) otteniamo dalLemma 2.2.2

χρ∗ = χρ, ρ∗ : G −→ V ∗ = HomC(V,C).

Otteniamo una rappresentazione di G su Hom(V,W ) data da:

ρ∗ ⊗ τ : G −→ Hom(V,W ), g 7−→ [f 7−→ [v 7→ τ(g)f(ρ(g)−1v)]]

Si noti che un elemento f ∈ Hom(V,W ) e invariante per G se τ(g)f(ρ(g)−1v) = f(v) per ogniv ∈ V e g ∈ G. Questa identita, per g−1 invece di g, e equivalente a f(ρ(g)v) = τ(g)f(v), cioe,f ∈ HomG(V,W ).

Per questo motivo un’applicazione G-equivariante e anche detta G-invariante.

2.2.4 Proiettori e idempotenti. Un elemento p in un algebra A e detto idempotentese p2 = p. Nel caso in cui A = End(V ) un idempotente e anche detto un proiettore, cioeun’applicazione lineare P : V → V e un proiettore se P 2 = P .

2.2.5 Lemma. Sia P ∈ End(V ) e un proiettore, allora

V = im(P )⊕ im(I − P ), e im(I − P ) = ker(P ).

In piu, anche I − P e un proiettore e si ha ker(P ) = im(I − P ).

Dimostrazione. Si noti che (I − P )(I − P ) = I − P − P + P 2 = I − P , quindi I − Pe un proiettore. Per mostrare la decomposizione di V , si noti che v = (Pv) + (I − P )v perogni v ∈ V , quindi V = im(P ) + im(I − P ). Poi se x ∈ imP , quindi x = Py per un certoy ∈ V , allora P 2 = P implica che Px = P 2y = Py = x, quindi Px = x, cioe P e l’identitasul sottospazio imP . Se x ∈ im(I − P ), quindi x = (I − P )z per un certo z ∈ V , alloraPx = P (I − P )z = (P − P 2)z = 0. Se v ∈ im(P ) ∩ im(I − P ), allora si ha Pv = v e Pv = 0,quindi v = 0. Si noti che rispetto a questa decomposizione l’applicazione P e data da:

P : v = vP + vI−P 7−→ vP , vP = Pv ∈ imP, vI−P = (I − P )v ∈ im(I − P ).

Da cio segue che im(I − P ) = ker(P ). 2

2.2.6 Lo spazio degli invarianti. Sia ρ : G → GL(V ) una rappresentazione di un grupposu uno spazio vettoriale V . Lo spazio degli invarianti e

V G := v ∈ V : ρ(g)v = v ∀g ∈ G.

Page 32: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 32

Come appena visto, Hom(V,W )G = HomG(V,W ).Sia G un gruppo finito. Se v ∈ V G allora ρ(g)v = v e quindi

∑g∈G ρ(g)v = v+ . . .+v = |G|v

dove |G| e l’ordine di G. Definiamo:

Π = Π0 : V −→ V, Π =1

|G|∑g∈G

ρ(g).

Allora per v ∈ V G si ha Πv = v. In piu, per ogni v ∈ V is ha Πv ∈ V G perche per ogni h ∈ G:

ρ(h)(Πv) =

(1

|G|∑g∈G

ρ(h)ρ(g)

)v =

(1

|G|∑g∈G

ρ(hg)

)v = Πv

(si noti che se g varia in G anche hg, per h ∈ G fissato, varia in G). L’applicazione lineare Π equindi un proiettore su V G: Π2 = Π, perche ΠV ⊂ V G e Π e l’identita su V G. Quindi

V = im(Π)⊕ ker(Π) = V G ⊕ ker(Π), v = (Πv, (I − Π)v).

Se prendiamo una base e1, . . . , ek di V G e una base ek+1, . . . , en di ker(Π) otteniamo una basee1, . . . , en di V rispetto alla quale la matrice P di Π ha tutti i coefficienti ugali a zero tranneP11 = P22 = . . . = Pkk = 1. In particolare Tr(Π) = dimV G. D’altra parte,

dimV G = Tr(Π) = Tr(1

|G|∑g∈G

ρ(g)) =1

|G|∑g∈G

Tr(ρ(g)) =1

|G|∑g∈G

χ(g).

Questa formula, in combinazione con il Lemma di Schur ha delle consequenze notevoli.Si noti che se G = S2, allora Πv = (v + ρ((12))v)/2 e (I − Π)v = (v − ρ((12))/2. Abbiamo

gia usato queste applicazioni nell’Esempio 2.1.5.

2.2.7 Caratteri irriducibili. Per studiare i caratteri delle rappresentazioni irriducibili,detti caratteri irriducibili, sfruttiamo il Lemma di Schur 2.1.7 che da, per le rappresentazioniirriducibili ρ : G→ V , τ : G→ W :

dimHomG(V,W ) =

1 se V ∼= W,0 se V 6∼= W.

Il risultato della sezione 2.2.6 precendente, applicato alla rappresentazione ρ∗ ⊗ τ di G suHom(V,W ) ci da:

dimHomG(V,W ) =1

|G|∑g∈G

χρ∗⊗τ (g) =1

|G|∑g∈G

χρ(g)χτ (g).

Questo suggerisce di definire, per un gruppo finito G, un prodotto scalare (Hermitiano) (·, ·)sullo spazio vettoriale complesso delle funzioni α : G→ C dato da

(α, β) :=1

|G|∑g∈G

α(g)β(g).

Page 33: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 33

Allora i caratteri irriducibili χ : G→ C di G sono ortonormali per questo prodotto scalare: seρ : G→ GL(V ) e τ : G→ GL(W ) sono rappresentazioni irriducibili allora

(χρ, χτ ) =1

|G|∑g∈G

α(g)β(g) = dimHomG(V,W ) =

1 se ρ ∼= τ,0 se ρ 6∼= τ.

In particolare, i caratteri delle rappresentazioni irriducibili sono indipendenti, percio il nu-mero delle rappresentazioni irriducibili di un gruppo finito e al piu |G|, la dimensione dellospazio delle funzioni G→ C. In realta, un carattere e costante sulle classi di coniugio (2.2.2.2),e quindi il numero delle rappresentazioni irriducibili e al piu il numero delle classi di coniugiodi G. Mostreremo l’ugualianza in 2.2.12.

Per esempio, se G = S3, le classi di coniugio sono (vedi anche 2.3.3)

e, (12), (13), (23), (123), (132),

quindi S3, che ha 6 elementi, ha al piu tre rappresentazioni irriducibili.Il seguente lemma, di frequente uso, e una semplice conseguenza del Teorema 2.1.3 e

dell’ortonormalita dei caretteri irriducibili.

2.2.8 Lemma. Siano χ1, . . . , χr i caratteri irriducibili di un gruppo finito G e sia ρi : G →GL(Vi) la rappresentazione irriducibile corrispondente: χi(g) = Tr(ρi(g)).

Sia ρ : G→ V una rappresentazione di G. Allora la decomposizione di ρ in rappresentazioniirriducibili e

V ∼= V n11 ⊕ V n2

2 ⊕ . . .⊕ V nrr , con ni = (χρ, χi).

Inoltre, si ha:(χρ, χρ) = n2

1 + n22 + . . . n2

r.

Dimostrazione. Il Teorema 2.1.3 garantisce che V ∼= V n11 ⊕V n2

2 ⊕. . .⊕V nrr per certe ni ∈ Z≥0.

Il carattere χρ di ρ e allora, vedi 2.2.2,4, il carattere n1χ1 + . . . + nrχr. Per calcolare gli nisfruttiamo l’ortonormalita dei caratteri irriducibili:

(χρ, χi) = (n1χ1 + . . .+ nrχr, χi) =∑j

nj(χj, χi) = ni.

Dunque si ha:

(χρ, χρ) = (n1χ1 + . . .+ nrχr, n1χ1 + . . .+ nrχr) =∑i,j

ninj(χi, χj) =∑i

n2i .

2

2.2.9 Esempio: il gruppo S3. Sia G = S3 il gruppo delle permutazioni di tre elementi esia ρ : S3 → W⊥ ∼= R2 la rappresentazione sul spazio perpendicolare a (1, 1, 1) ∈ R3 costruitonell’Esempio 2.1.6. Poiche R3 = W ⊕W⊥ e W e la rappresentazione banale, quindi ρ(g) = 1per ogni g ∈ S3 e percio χW (g) = 1, abbiamo χρ = 1 + χW⊥ . Ovviamente (vedi Lemma 2.2.2)

Page 34: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 34

χW⊥(e) = dimW⊥ = 2. Se g = (12) allora ρ(g) fissa e3 e permuta e1 ed e2, quindi χρ((12)) = 1e χW⊥((12)) = 0. Poiche un carattere e costante sulle classi di coniugio, si ha χW⊥(g) = 0 perognuno dei tre 2-cicli. Se g = (123), la traccia di ρ(g) e zero, e quindi χW⊥((123)) = −1, equesto vale anche per l’altro 3-ciclo (132). Da qui segue:

(χW⊥ , χW⊥) =1

6(22 + 3 · 02 + 2 · (−1)2) =

6

6= 1.

La conclusione e che χW⊥ e una rappresentazione irriducibile, perche nella decomposizione inirriducibili χW⊥ =

∑niχi come nel Lemma 2.2.8 si ha

∑n2i = 1 e quindi esattamente una

delle ni e 1 e le altre sono zero.Adesso conosciamo tre rappresentazioni irriducibili di S3: la rappresentazione banale, con

carattere χ0(g) = 1 per ogni g ∈ S3, la rappresentazione data dal segno di una permutazione,ε : S3 → ±1 ⊂ GL(C), e la rappresentazione due dimensionale appena costruita. Di solito, icaratteri irriducibile sono messi in una tabella dei caratteri come qui sotto.

S3 e (12), (23), (13) (123), (132)χ0 1 1 1χε 1 -1 1χW⊥ 2 0 -1

Il prodotto scalare e dato da (1/6)(a1b1 + 3a2b2 + 2a3b3) dove (a1, a2, a3) e (b1, b2, b3) sono duerighe di questa matrice. Si verifica facilmente l’ortonormalita dei caratteri irriducibili.

2.2.10 La rappresentazione regolare. Per trovare il numero delle rappresentazioni ir-riducibili si studia la rappresentazione regolare di un gruppo finito G. Si consideri lo spaziovettoriale C[G], di dimensione |G|, con vettori di base gli eg dove g varia in G. E facile verificareche si ha una rappresentazione

ρ = ρR : G −→ GL(C[G]), ρ(g)eh = egh.

Poiche egh = eh se e solo se g = e, il carattere di questa rappresentazione e particolarmentesemplice:

χR(g) := χρR(g) =

|G| se g = e,0 se g 6= e.

Nella decomposizione in irriducibili C[G] = V n11 ⊕ V n2

2 ⊕ . . .⊕ V nrr (cf. Lemma 2.2.8) si ha

allora:

ni = (χR, χi) =1

|G|∑g∈G

χR(g)χi(g) = χi(e) = dimVi,

cioe ogni rappresentazione irriducibile compare in ρR con moltiplicita uguale alla suadimensione! Un altro risultato e:

|G| = dim C[G] = dim(V n11 ⊕ V n2

2 ⊕ . . .⊕ V nrr ) = (dimV1)2 + . . .+ (dimVr)

2,

che da, per esempio, una stima della dimensione di una rappresentazione irriducible di G.

Page 35: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 35

2.2.11 Lo spazio generato dai caratteri. Sia ρ : G→ GL(V ) una rappresentazione di ungruppo finito e sia α : G −→ C una funzione che e costante sulle classi di coniugio. Definiamoun endomorfismo di V con:

Φα,ρ : V −→ V, Φα,ρ =∑g∈G

α(g)ρ(g).

Allora Φα,ρ e G-equivariante:

Φα,ρρ(h) =∑g∈G

α(g)ρ(g)ρ(h) =∑g∈G

α(g)ρ(gh),

ed inoltre si noti che gh = h(h−1gh) e che, per ipotesi, α(g) = α(h−1gh) quindi:

Φα,ρ(ρ(h)v) =∑g∈G

α(g)ρ(gh) =∑g∈G

α(h−1gh)ρ(h)ρ(h−1gh) = ρ(h)∑g∈G

α(g)ρ(g) = ρ(h)Φα,ρ

dove abbiamo usato che h−1gh varia in tutto G se g varia in tutto G.Supponiamo adesso che una funzione α : G → C sia costante sulle classi di coniugio e

che (α, χi) = 0 per ogni rappresentazione irriducibile di G. Per il Lemma di Schur, per ognirappresentazione irriducibile ρi di G si ha Φα,ρi = λiI per un certo numero complesso λi. QuindiTr(Φα,ρi) = niλi dove ni = dimVi:

λi =1

niTr(Φα,ρi) =

1

ni

∑g∈G

α(g)Tr(ρi(g)) =|G|ni

(α, χi).

Poiche (α, χi) = 0 per ipotesi, abbiamo allora λi = 0 e quindi Φα,ρi = 0 per ogni rappresen-tazione irriducibile di G. Percio Φα,ρ e zero per ogni rappresentazione ρ di G. Pero nella rapp-resentazione regolare ρR le matrici ρR(g) sono indipendenti in End(C[G]), per esempio ρR(g) el’unica matrice per cui il coefficiente ρg,e 6= 0 (questo perche ρ(h)ee = eh, quindi la prima colonnadi ρ(h) ha un unico coefficiente 1 e gli altri zero). In particolare, se Φα,ρR =

∑g α(g)ρR(g) = 0

allora α(g) = 0 per ogni g ∈ G e quindi α = 0. Pertanto, ogni funzione α : G → C che ecostante sulle classi di coniugio e contenuta nello spazio vettoriale generato dai caratteri dellerappresentazioni irriducibili. Poiche questi caratteri sono ortonormali si ha:

2.2.12 Teorema. I caratteri irriducibili formano una base ortonormale dello spazio vettorialedelle funzioni G→ C che sono costanti sulle classi di coniugio.

In particolare, il numero delle rappresentazioni irriducibili di G e uguale al numero delleclassi di coniugio di G.

2.2.13 Esempio: gruppi abeliani. Sia G un gruppo abeliano, cioe gh = hg per ognig, h ∈ G. Allora hgh−1 = g per ogni g, h ∈ G e quindi ogni elemento di G e una classedi coniugio. Percio il numero delle classi di coniugio e r = |G|, che e anche il numero dellerappresentazioni irriducibili di G.

Page 36: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 36

Poiche∑r

i=1 n2i = |G|, dove gli ni sono le dimenionsioni delle rappresentazioni irriducibile

di G, ogni rappresentazione irriducibile di G ha dimensione uno(!).

2.2.14 Il groupring. Lo spazio vettoriale C[G] (vedi 2.2.10) e una C-algebra conmoltiplicazione:

(∑

xgeg)(∑

ygeg) =∑g,h

xgyhegh =∑

(∑hk=g

xhyk)eg.

Si noti che il prodotto non e commutativo se G non e commutativo. Questa algebra si chiamail groupring di G. Una rappresentazione ρ : G→ GL(V ) induce un omomorfismo di algebre:

ρ : C[G] −→ End(V ),∑

xgeg 7−→∑

xgρ(g).

Siano ρi : G→ Vi (i = 1, . . . , r), le rappresentazioni irriducibili di G e sia

ρ := ⊕ri=1ρi : G −→r∏i=1

GL(Vi).

Come abbiamo gia notato, dim C[G] = |G| =∑

i(dimVi)2 =

∑i dimEnd(Vi) e l’omomorfismo

ρ : C[G] −→ ⊕ri=1End(Vi)

e un isomorfismo. Per mostrare questo, si ricordi che la rappresentazione regolare ρR su C[G]e isomorfa a ⊕iV ni

i , dove i Vi sono le rappresentazioni irriducibili di G e ni = dimVi. Quindiesiste una matrice M ∈ GL(N), con N = |G| = dim C[G], tale che

SρR(g)S−1 = diag(ρ1(g), . . . , ρ1(g)︸ ︷︷ ︸n1

, . . . , ρr(g), . . . , ρr(g)︸ ︷︷ ︸nr

)

e una matrice con blocchi diagonali. Il sottospazio di End(CN) generato dalle SρR(g)S−1,dove g varia in G, ha dimensione |G| perche S e invertibile e i ρR(g), dove g varia in G, sonoindipendenti (vedi 2.2.11). Quindi anche il sottospazio di End(CM), con M = n1 +n2 + . . .+nr,generato dalle matrici

ρ(g) = diag(ρ1(g), ρ2(g), . . . , ρr(g)).

ha dimensione |G| e percio ρ e un isomorfismo di spazi vettoriali. Poiche ρ e l’estensione C-lineare di una rappresentazione di G si ha ρ(xy) = ρ(x)ρ(y), e quindi ρ e un isomorfismo dialgebre. Vedi 2.4.2 per un esempio.

2.3 Le classi di coniugio di Sm

2.3.1 Classi di coniugio. Si ricordi che due elementi g, g′ di un gruppo G sono detti coniugatise esiste un h ∈ G tale che g′ = hgh−1. L’essere coniugati (o il coniugio) e una relazione di

Page 37: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 37

equivalenza. Quindi le classi di equivalenza sono una partizione di G. Se C ⊂ G e un classe diconiugio e g ∈ C e un qualunque elemento di C allora

C = Cg = hgh−1 : h ∈ G.

Per esempio, se G e un gruppo abeliano allora ogni classe di coniugio consiste di un soloelemento perche hgh−1 = hh−1g = g per ogni g, h ∈ G. Per ogni gruppo G la classe di coniugiodell’elemento neutro e ∈ G ha un solo elemento: Ce = e.

2.3.2 Decomposizione di permutazioni in cicli. Si ricordi che il gruppo Sm e l’insieme delleapplicazioni biiettive g : 1, . . . ,m → 1, . . . ,m con prodotto la composizione (g1g2)(i) :=g1(g2(i)) per ogni i ∈ 1, . . . ,m.

Un ciclo e un elemento g ∈ Sm tale che ci siano interi distinti i1, . . . , ir ∈ 1, . . . ,m per iquali

g(i1) = i2, g(i2) = i3, . . . , g(ir−1) = g(ir), g(ir) = i1, g(i) = i se i 6∈ i1, . . . , ir.

Si scrive g = (i1 i2 . . . ir), g e detto un r-ciclo e l’ordine del ciclo e |g| = r (questo e propriol’ordine dell’elemento g ∈ Sm).

Ogni permutazione e un prodotto di cicli disgiunti ([A], Proposizione 6.6). Si noti che sec, c′ sono due cicli disgiunti, allora commutano tra loro: cc′ = c′c.

Per esempio, l’identita e e il prodotto di m uno cicli: e = (1)(2) . . . (m), e la decomposizionein cicli della permutazione g ∈ S4 con

g(1) = 3 g(2) = 2, g(3) = 4, g(4) = 1 e g = (134)(2).

Sia g ∈ Sm e sia g = c1c2 . . . ck la decomposizione di g in cicli disgiunti. Sia mi = |ci| ∈ Z>0

l’ordine del ciclo ci, allora m = m1 + m2 + . . . + mk. Poiche cicj = cjci possiamo scrivere ognipermutazione g ∈ Sm come prodotto di cicli disgiuni nel modo seguente:

g = c1c2 . . . ck, |c1| ≥ |c2| ≥ . . . ≥ |cr|

la somma m = |c1|+ |c2|+ . . .+ |cr| e detta partizione di un intero m associato ad g.Per esempio g = (134)(2) da la partizione 4 = 3 + 1 e l’identita di Sm da la partizone

m = 1 + 1 + . . .+ 1.

2.3.3 Le classi di coniugio di Sm. Sia c = (i1 i2 . . . ir) ∈ Sm un r-ciclo e sia h ∈ Sm, allorae facile determinare il coniugato hch−1 che risulta essere anch’esso un r-ciclo. Infatti si ha:

h(i1 i2 . . . ir)h−1 = (h(i1)h(i2) . . . h(ir)),

perche se i 6∈ h(i1), . . . , h(ir) allora h−1(i) 6∈ i1, . . . , ir e quindi (ch−1)(i) = c(h−1(i)) =h−1(i), percio (hch−1)(i) = h(h−1(i)) = i; se invece i = h(ij) per un certo j, allora (ch−1)(i) =c(ij) = ij+1 (con j + 1 = 1 se j = r) e percio (hch−1(h(ij)) = h(ij+1).

Page 38: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 38

Se g = c1c2 . . . cr allora

hgh−1 = h(c1c2 . . . cr)h−1 = (hc1h

−1)(hc2h−1) . . . (hcrh

−1).

Quindi ogni elemento in una classe di coniugio di una permutazione che e prodotto di r ciclicon ordine m1, . . . ,mr e un prodotto di r cicli con ordine m1, . . . ,mr. In particolare gli elementiin una classe di coniugio di Sm determinano la stessa partizione di m. Non e difficile verificareche se due elementi in Sm determinano la stessa partizione, allora sono tra loro coniugati ([A],Proposizione 6.10(c)).

Per esempio, siano g = (134)(2), g′ = (1)(243) ∈ S4. Entrambi due determinano la par-tizione 4 = 3 + 1. Allora g = hg′h−1 con h = (12)(34) perche hg′h−1 = (h(1))(h(2)h(4)h(3)) =(2)(134) = g.

Quindi le classi di coniugio di Sm sono in biiezione con le partizioni di m. La classe diconiugio determinata dalla partizione m = m1 +m2 + . . .+mr e indicato con Cm1,m2,...,mr .

Per esempio S3 ha tre classi di coniugio perche 3 ha esattamente tre partizioni:

3 = 3, 3 = 2 + 1, 3 = 1 + 1 + 1.

Le classe di coniugio di S3 sono (dove non scriviamo gli 1-cicli):

C3 = (123), (132), C2,1 = (12), (13), (23), C1,1,1 = e.

Il gruppo S4 ha 5 classi di coniugio perche 4 ha esattamente cinque partizioni:

4 = 4, 4 = 3 + 1, 4 = 2 + 2, 4 = 2 + 1 + 1, 4 = 1 + 1 + 1 + 1.

le classe di coniugio di S4 sono (dove non scriviamo gli 1-cicli):

C4 = (1234), (1243), . . ., C3,1 = (123), (132), . . ., C2,2 = (12)(34), (13)(24), . . .

C2,1,1 = (12), (13), . . ., C1,1,1,1 = e.

Lasciamo al lettore la verifica del fatto che il numero di elementi in ogni classe di coniugio edato da:

|C4| = 6, |C3,1| = 8, |C2,2| = 3, |C2,1,1| = 6, |C1,1,1,1| = 1,

si noti che∑

λ |Cλ| = |S4| = 24.

2.3.4 Esempio. Date le classe di coniugio in S4 non e difficile trovare i caratteri irriducibili,come abbiamo gia fatto per S3 in 2.2.9. Ci sono la rappresentazione banale, con carattereχ0 e il segno, con carattere χε. Poi c’e la rappresentazione 3 dimensionale ρ3 su W⊥ (vedi2.1.6), e facile trovare il suo carattere χW⊥ e verificare che (χW⊥ , χW⊥) = 1, quindi χW⊥ e uncarattere irriducibile. Poiche χW⊥((12)) = 1, segue che la rappresentazione ρ3 tensorizzata conε ha un carattere, dato da χρ3⊗ε(g) = χW⊥(g)χε(g) che e diverso da χW⊥ e che risulta essereirriducibile. Poi si trova il carattere di una quinta rappresentazione irriducile determinando

Page 39: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 39

un vettore a = (a1, . . . , a5) perpendicolare ai quattro caratteri gia trovati e poi il caratteremancante e dato da a′ = λa dove λa1 > 0 (sarebbe la dimensione della quinta rappresentazione)e (a′, a′) = 1. La tabella dei caratteri di S4 e quindi quella qui sotto, dove la prima riga da lacardinalita dei classi di coniugio.

1 6 3 8 6S4 C1,1,1,1 C2,1,1 C2,2 C3,1 C4

χ0 1 1 1 1 1χε 1 -1 1 1 -1χρ3 3 1 -1 0 -1χρ3⊗ε 3 -1 -1 0 1χρ2 2 0 2 -1 0

Il carattere χρ2 di S4 e molto simile al carattere χW⊥ di S3 (vedi 2.2.9). Infatti, esiste unomomorfismo suriettivo φ : S4 → S3 tale che ρ2 e la composizione di φ con la rappresentazioneρW⊥ : S3 → GL(W⊥). Per definire φ, si noti che S4 ha una classe di coniugio

C2,2 = x1 = (12)(34), x2 = (13)(24), x3 = (14)(23)

con soltanto 3 elementi. La coniugazione con g ∈ S4 induce una permutazione di questi elementi,quindi esiste una permutazione σ degli indici 1, 2, 3 tale che gxig

−1 = xσ(i). Cio definisceun’applicazione

φ : S4 −→ S3, g 7−→ σ se gxig−1 = xσ(i)

e si verifca facilmente che φ e un omomorfismo. Un rapido conto mostra che:

φ((12)) = (23), φ((123)) = (132), φ((12)(34)) = e, φ((1234)) = (13).

A questo punto e facile verificare che il carattere della rappresentazione ρW⊥φ : S4 → GL(W⊥)e χρ2 . Per n > 4 non ci sono omomorfismi suriettivi Sn → Sm con m > 2 (per m = 2 c’e ilsegno perche S2

∼= ±1).

2.4 Le rappresentazioni irriducibili del gruppo simmetrico

2.4.1 Sottospazi invarianti nel groupring. Ogni rappresentazione irriducibile ρ di ungruppo finito G e presente, con molteplicita dim(ρ), nella rappresentazione regolare ρR delgruppo (vedi 2.2.10) sul groupring C[G]. Per g ∈ G e x ∈ C[G] si ha ρR(g)x = gx, quindi, perogni y ∈ C[G] il sottospazio C[G]y ⊂ C[G] e G invariante, semplicemente perche se x ∈ C[G]yallora x = zy per un certo z ∈ C[G] e

ρR(g)x = ρR(g)zy = ρR(g)zy = (gz)y ∈ C[G]y.

Usando l’isomorfismo del groupring con il prodotto di algebre di matrici di 2.2.14, non e difficilemostrare che, dato ρ, esiste cρ ∈ C[G] tale che il sottospazio G-invariante C[G]cρ sia la rappre-sentazione irriducibile ρ di G. Nel caso del gruppo simmetrico, esistono espressioni esplicite pertali elementi, che si chiamano ‘simmetrizzatori di Young’(‘Young symmetrizers’), vedi 2.4.3.

Page 40: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 40

2.4.2 Esempio. Per dare un isomorfismo esplicito tra C[S3] e M1(C) × M1(C) × M2(C),determiniamo prima la rappresentazione ρ2 := ρW⊥ : S3 → GL(2,C) in modo esplicito.

Una base di W⊥ = 〈(1, 1, 1)〉⊥ ⊂ C3 e data da f1, f2 (e f1 + f2 + f3 = 0):

f1 = (2,−1,−1), f2 = (−1, 2,−1), f3 = (−1,−1, 2), g fi = fg(i)

in particolare, S3 permuta gli fi. Le matrici dei ρ2(g) rispetto a questa base sono:

ρ2((12)) =

(0 11 0

), ρ2((13)) =

(−1 0−1 1

), ρ2((23)) =

(1 −10 −1

)e

ρ2((123)) =

(0 −11 −1

), ρ2((213)) =

(−1 1−1 0

),

e, ovviamente, ρ2(e) = I. Otteniamo un isomorfismo

ρ : C[S3] −→M1(C)×M1(C)×M2(C),∑

xgeg 7−→∑

xg(1, ε(g), ρ(g)).

Si noti che

ρ((12)) + ρ((13)) + ρ((23)) = (3,−3, 0), ρ((123)) + ρ((132)) = (2, 2,−I).

Quindi troviamo:

(1, 0, 0) = (1/6)(∑g∈S3

ρ(g)) = Π0, (0, 1, 0) = (1/6)(∑g∈S3

ε(g)ρ(g)) =: Πε,

dove riconosciamo il proiettore sullo spazio degli invarianti Π = Π0 (vedi 2.2.6). Si noti inparticolare che

C[G]Π0∼= M1(C), (a, b, c) 7−→ (a, 0, 0)

da la sottorappresentazione banale di C[g]. Similmente, il sottospazio G-invariante C[G]Πε =(0, b, 0) : b ∈ C di C[G] e la rappresentazione data dal segno. Il proiettore corrispondentealla rapresentazione due dimensionale e:

(0, 0, I) = (2/3, 2/3, (2/3)I)− (2/3, 2/3,−(1/3)I)= (2/3)ρ(e)− (1/3)(ρ((123)) + ρ((132))=: Π2.

Quindi il sottospazio G-invariante C[G]Π2 e isomorfo a M2(C), che e 4-dimensionale. La rap-presentazione di G = S3 su C[G]Π2 e isomorfa a due copie della rappresentazione irriducibileρ2.

Se vogliamo un elemento c2 ∈ C[G] tale che C[G]c2 sia due dimensionale e tale che larappresentazione di S3 su questo sottospazio sia ρ2, dobbiamo avere che ρ(c2) = (0, 0, P ) conP una matrice di rango uno. Allora C[G]c2

∼= M2(C)P , e si puo mostrare che e costituitadalle matrici 2 × 2 che hanno lo stesso nucleo (di dimensione uno) di P ed e un sottospazio

Page 41: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 41

di dimensione due di M2(C). Poiche questo sottospazio e G-invariante ed e contenuto nellarappresentazione ρ2 ⊕ ρ2, da la rappresentazione ρ2 di G. Un esempio e:

c2 = e+ e(13) − e(12) − e(123) ∈ C[S3], ρ(c) = (0, 0, P ),

dove

P = ρ2(c2) =

(1 00 1

)+

(−1 0−1 1

)−(

0 11 0

)−(

0 −11 −1

)=

(0 0−3 3

).

2.4.3 Diagrammi di Young e simmetrizzatori di Young. Data una partizione di unintero m ∈ Z>0, m = m1 + . . .+mr, il suo diagramma di Young e una figura con m quadri, mi

nella i-esima riga, come negli esempi in figura:

,

3=1+1+1

,

4=4

.

8=4+3+1

Data la partizione λ = (m1, . . . ,mr) di m, vogliamo costruire un elemento cλ in C[Sm]. Perquesto, scriviamo i numeri 1, 2 . . . ,m nel diagramma di Young come nell’esempio (in realta,cambiando l’ordine dei numeri si ottiene un elemento con proprieta simili e la rappresentazionedefinita e la stessa).

,123

,1 2 3 4 .1 4 6 82 5 73

Poi definiamo due sottogruppi di Sm associati alla partizione λ = (m1, . . . ,mr) di m:

P = Pλ = g ∈ Sm : g permuta gli elementi di ogni riga

eQ = Qλ = g ∈ Sm : g permuta gli elementi di ogni colonna .

Per esempio:P1,1,1 = e, Q1,1,1 = S3; P4 = S4, Q4 = e.

Si ha P4,3,1∼= S4 × S3 × S1 e Q4,3,1

∼= S3 × S2 × S2 × S1 (dove S1 = e), pero S3 sottogruppodi P4,3,1 permuta i tre elementi di 2, 5, 7 e fissa gli altri elementi in 1, . . . , 8, invece i gruppisimmetrici in Q permutano rispettivamente gli elementi di 1, 2, 3, 4, 5, 6, 7, e fissano glialtri.

Page 42: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 42

Usando i sottogruppi P e Q associati alla partizione λ = (m1, . . . ,mr) di m, definiamo dueelementi di C[G]:

aλ :=∑g∈P

eg, bλ :=∑g∈Q

ε(g)eg,

dove ε : Sm → ±1 e il segno. Poi definiamo il ‘simmetrizzatore di Young’

cλ := aλbλ (∈ C[Sm]).

Il risultato principale, che non dimostriamo, vedi [FH], Theorem 4.3, e:

2.4.4 Teorema. Sia λ = (m1, . . . ,mr) una partizione di m. Allora il sottospazio Sm-invariantedel groupring C[Sm] definito da cλ:

Vλ := C[Sm]cλ

e una rappresentazione irriducibile, indicata con ρλ, di Sm.In questo modo si ottiene una biiezione tra le partizioni di m e le rappresentazioni irriducibili

di Sm.

2.4.5 Esempio. Un esempio semplice e dato dalla partizione m = m. In questo caso P = Sm,Q = e, quindi

am =∑g∈Sm

eg, bm = ee, quindi cm = am.

Poiche ehcm =∑

g eheg =∑

g ehg =∑

g eg = cλ, e gli eh sono una base di C[Sm] troviamo cheC[Sm]cm = Ccm, uno spazio unidimensionale. Poiche ρR(h)eg = ehg si ha ρR(h)cm = cm, percioWm = C[Sm]cm e la rappresentazione banale di Sm.

Se λ = (1, 1, . . . , 1), si ha P = e, quindi aλ = ee, e Q = Sm. Percio

cλ = c(1,...,1) = b(1,...,1) =∑g

ε(g)eg.

Si noti cheehcλ =

∑g

ε(g)eheg =∑g

ε(g)ehg =∑k

ε(h−1k)ek = ε(h)cλ,

dove k = hg varia in Sm se g varia in Sm e abbiamo usato che ε e un omomorfismo:ε(xy) = ε(x)ε(y), ε(x−1) = ε(x)−1. Segue che Wλ = C[Sm]cλ = Ccλ e unidimensionale eche la rappesentazione di Sm su Wλ e data da ε : Sm → GL(C) perche ρR(h)cλ = ε(h)cλ.

Nel caso λ = (2, 1), abbiamo:

P2,1 = e, (13), Q2,1 = e, (12) quindi a2,1 = ee + e(13), bλ = ee − e(12),

percio il simmetrizzatore di Young di λ e:

cλ = (ee + e(13))(ee − e(12)) = ee2 + e(13)e − ee(12) − e(13)(12) = ee + e(13) − e12) − e(123),

Page 43: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 43

e questo e proprio l’elemento c2 di 2.4.2. In 2.4.2 abbiamo visto che C[S3]c2 e la rappresentazioneirriducibile, due dimensionale, di S3. Diamo una verifica esplicita di questo fatto.

Poiche Vλ = C[S3]cλ e due dimensionale (vedi anche la formula in 2.4.6), una base di Vλ edata da cλ, gcλ per un qualunque g ∈ S3 tale che questi due elementi siano indipendenti (cioesclude ovviamente g = e e, meno ovvio, g = (13)). Prendiamo g = (12) allora:

(12)cλ = (12)(ee + e(13) − e12) − e(123)) = e(12) + e(132) − ee − e(23),

quindi cλ, (12)cλ sono indipendenti nello spazio vettoriale C[S3]. Poiche (12)2 = e, (12) scambiaquesti due vettori. In particolare, la matrice di moltiplicazione per (12) su questa base ha tracciazero. Allora si verifica che

(123)cλ = e(123)+e(23)−e(13)−e(132) = −cλ−(12)cλ, (123)(12)cλ = e(13)+e−e(123)−e(12) = cλ.

Quindi il sottospazio generato da cλ, (12)cλ e invariante per (12), (123) e, poiche queste duepermutazioni generano S3, tale sottospazio e invariante per S3. Le matrici di moltiplicazionesono:

ρλ : (12) 7−→(

0 11 0

), ρλ : (123) 7−→

(−1 1−1 0

).

In particolare, Tr(ρλ((12))) = 0 , Tr(ρλ((123))) = −1 e ovviamente Tr(ρλ(e)) = 0. E facileverificare (e l’abbiamo gia fatto!) che questo carattere e irriducibile. Segue che la rappresen-tazione ρλ e equivalente alla rappresentazione ρ2 di 2.4.2. Infatti, basta scambiare i due vettoridi base cλ, (12)cλ per ottenere le matrici di ρ2.

2.4.6 La dimensione di Vλ. Esiste un modo semplice per determinare la dimensione dellarappresentazione irriducibile Vλ. Sia λ = m1, . . . ,mr, con m = m1 + . . .+mr, e consideriamoil diagramma di Young della partizione λ. Nel quadrato nella i-esima riga e j-esima colonnamettiamo il numero hij := 1 + dij + sij, dove dij e il numero dei quadrati a destra e sij eil numero dei quadrati sotto questo quadrato (questo numero si chiama la ‘hooklength’ delquadrato). Allora si ha

dimVλ =m!∏i,j hij

.

Qualche esempio:

λ = 3 22 1

, µ = ,6 4 3 14 2 11

ρ =. . .. . . .m m−2

12 1

Quindi la partizione λ = 2, 2 di m = 4 definisce la rappresentazione irriducibile Vλ di S4 cheha dimensione

dimVλ =4 · 3 · 2 · 13 · 2 · 2 · 1

= 2

Page 44: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

2 RAPPRESENTAZIONI DI GRUPPI FINITI 44

e, poiche S4 ha un’unica rappresentazione irriducibile di dimensione due, Vλ e larappresentazione ρ2 trovata in 2.3.4.

Si noti che Vµ e una rappresentazioe irriducibile di S8 di dimensione (8!)/(6 ·4 ·4 ·2 ·3) = 70.La partizione ρ = m− 1, 1 di m definisce una rappresentazione irriducibile Vρ di Sm che

ha dimensione

dimVρ =m(m− 1)(m− 2)!

m · ((m− 2)!) · 1= m− 1.

Si puo mostrare che Vρ e la rappresentazione W⊥ di 2.1.6.

Page 45: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 45

3 Tensori e gruppo simmetrico

Testi consigliati: [FH].

3.1 Introduzione e risultati generali

3.1.1 L’azione di Sm su TmV Sia V uno spazio vettoriale reale di dimensione n. Per unintero m ∈ Z≥0 sono stati definiti nella sezione 3.1 gli spazi vettoriali:

T 0(V ) = R, T 1V = V, TmV := V ⊗ V ⊗ . . .⊗ V︸ ︷︷ ︸m

.

Per g ∈ Sm, l’applicazione τ(g) : TmV → TmV e per definizione la permutazione dei fattoridel prodotto tensoriale che corrisponde a g. Quindi si sposta l’i-esima componente del prodottotensoriale nella g(i)-esima componente. Per esempio, se v1, v2, v3 ∈ V :

τ((123)) : v1 ⊗ v2 ⊗ v3 7−→ v3 ⊗ v1 ⊗ v2,

perche (123) manda 1 7→ 2 quindi v1 compare nel secondo fattore dell’immagine, poi 2 7→ 3quindi v2 compare nell’ultimo fattore, ecc. Si noti che v3 ⊗ v1 ⊗ v2 6= vg(1) ⊗ vg(2) ⊗ vg(3).

Per ottenere una formula per τ(g) si noti che

τ(g) : v1 ⊗ v2 ⊗ . . .⊗ vm 7−→ y1 ⊗ y2 ⊗ . . .⊗ ym = vg−1(1) ⊗ vg−1(2) ⊗ . . .⊗ vg−1(m)

perche, per definizione di τ , yj = vi dove j = g(i), cioe i = g−1(j) e percio yj = vg−1(i).E’ facile verificare che τ : Sm → GL(TmV ) e un omomorfismo: se τ(h)(y1 ⊗ . . . ⊗ ym) =

z1 ⊗ . . .⊗ zm allorazk = yh−1(k) = vg−1(h−1(k)) = v(hg)−1(k)

quindi

τ(h)(τ(g)(v1 ⊗ . . .⊗ vm)) = v(hg)−1(1)⊗ . . .⊗ v(hg)−1(m) = τ(hg)(v1 ⊗ . . .⊗ vm).

Si puo anche considerare un’azione di Sm da destra, su TmV , data da (v1 ⊗ . . .⊗ vm) · σ =vσ(1) ⊗ . . . ⊗ vσ(m) (vedi [FH], p.76, questo rende un po’ faticoso il confronto tra varie formuleesplicite ma non cambia la sostanza).

3.1.2 L’azioni dei gruppi GL(V ) e Sm su TmV . Il gruppo GL(V ) agisce su TmV tramitel’omomorfismo

ρ : GL(V ) −→ GL(TmV ), ρ(A)(v1 ⊗ v2 ⊗ . . . . . .⊗ vm) = (Av1)⊗ (Av2)⊗ . . .⊗ (Avm).

Il gruppo simmetrico Sm agisce su TmV tramite l’omomorfismo (vedi 3.1.1:

τ : Sm −→ GL(TmV ), τ(σ−1)(v1 ⊗ v2 ⊗ . . . . . .⊗ vm) = vσ(1) ⊗ vσ(2) ⊗ . . .⊗ vσ(m).

Page 46: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 46

Queste azioni commutano, cioe:

ρ(A)τ(σ−1) = τ(σ−1)ρ(A),

per ogni A ∈ GL(V ) e ogni σ ∈ Sm, infatti, entrambe mandano

v1 ⊗ v2 ⊗ . . . . . .⊗ vm 7−→ (Avσ(1))⊗ (Avσ(2) ⊗ . . .⊗ (Avσ(m)).

Spesso non scriveremo gli omomorfismi ρ, τ , ma semplicemente A(v1⊗. . . . . .⊗vm) = (Av1)⊗. . .⊗ (Avm) e σ−1(v1 ⊗ . . . . . .⊗ vm) = vσ(1) ⊗ . . .⊗ vσ(m).

3.1.3 Esempio. Consideriamo il caso n = 2. Il gruppo S2 ha soltanto due elementi, S2 =e, g = (12). Poiche g2 = e e τ(e) = I, l’identita su T 2V , τ(g) : T 2V → T 2V e un’applicazionelineare con τ(g)2 = I. Quindi ogni elemento t di T 2V si scrive nel modo seguente:

t = (t+ τ(g)t)/2 + (t− τ(g)t)/2

e, poiche τ(g)((t + τ(g)t)/2) = (t + τ(g)t)/2, τ(g)((t − τ(g)t)/2) = −(t − τ(g)t)/2, ladecomposizione di T 2V in autospazi di τ(g) e:

T 2V = S2V ⊕ A2V, S2V = x ∈ T 2V : τ(g)x = x , S2V = x ∈ T 2V : τ(g)x = −x ,

3.1.4 Gli spazi A2V e ∧2V . Se e1, . . . , en e una base di V , allora ei ⊗ ej, 1 ≤ i, j ≤ n euna base di T 2V e τ(g)(ei ⊗ ej) = ej ⊗ ei. Quindi otteniamo una base di S2V e A2V nel modoseguente:

S2V = 〈e1 ⊗ e1, . . . , en ⊗ en, e1 ⊗ e2 + e2 ⊗ e1, . . . , en−1 ⊗ en + en−1 ⊗ en〉,

A2V = 〈e1 ⊗ e2 − e2 ⊗ e1, . . . , en−1 ⊗ en − en−1 ⊗ en〉.

Nella sezione 1.3.1 abbiamo definito il prodotto esterno ∧2V di V e un’applicazione canonica

Ψ : T 2V −→ ∧2V, u⊗ v 7−→ u ∧ v = −v ∧ u.

Lo spazio vettoriale ∧2V ha una base data dalle ei ∧ ej con 1 ≤ i < j ≤ n. Poiche Ψ(ei⊗ ei) =ei ∧ ei = −ei ∧ ei = 0 e Ψ(ei ⊗ ej) = ei ∧ ej, si ha Ψ(S2V ) = 0 e la restrizione ΨA di Ψ ad A2Ve un isomorfismo, con inversa Φ−1

A data da:

Ψ−1A : ∧2V

∼=−→ A2V, Ψ−1A (u ∧ v) = 1

2(u⊗ v − v ⊗ u).

Spesso si scrive (identificando A2V e ∧2V ):

u ∧ v := 12(u⊗ v − v ⊗ u).

In modo simile, scriviamo

u v := 12(u⊗ v + v ⊗ u) (∈ S2V ),

Page 47: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 47

si dice che u v e il prodotto simmetrico di u e v.

3.1.5 Decomposizioni. Gli autospazi S2V e A2V di τ(g) nell’ esempio 3.1.3 sono invariantiper GL(V ):

ρ(A)(S2V ) ⊂ S2V, ρ(A)(A2V ) ⊂ A2V (A ∈ GL(V )),

come si verifica per esempio considerando l’azione di GL(V ) sui vettori di base di S2V e diA2V .

Per generalizzare questa decomposizione consideriamo uno spazio vettoriale W , due gruppi,G e H, e due omomorfismi

ρ : G −→ GL(W ), τ : H −→ GL(W ), t.c. ρ(g)τ(h) = τ(h)ρ(g)

per ogni g ∈ G, h ∈ H, cioe le azioni di G e H commutano. Sia data una decomposizione

W = W1 ⊕W2 t.c. ρ(h)Wi ⊂ Wi

per ogni h ∈ H, cioe gli spazi W1, W2 sono H-invarianti (si dice anche che W1,W2 sonosottorappresentazioni di H). Sia (come in 2.1.1)

HomH(W1,W2) := f ∈ Hom(W1,W2) : f(ρ(h)w1) = ρ(h)f(w1) ∀w1 ∈ W1.cioe HomH(W1,W2) e l’insieme (in effetti uno spazio lineare) delle applicazioni lineari W1 → W2

che commutano con l’azione di H, dette applicazioni H-equivarianti.

3.1.6 Lemma. Siano ρ : G → GL(W ) e τ : H → GL(W ) rappresentazioni che commutano.Sia W = W1 ⊕W2 e supponiamo che HomH(W1,W2) = 0. Allora W1 e G-invariante.

Dimostrazione. Per g ∈ G e w1 ∈ W1, il vettore ρ(g)w1 ∈ W = W1 ⊕W2 si scrive come

ρ(g)w1 = (ρ1(g)w1, ρ2(g)w1) ∈ W1 ⊕W2,

ed e facile verificare che le ρi(g) : W1 → Wi, i = 1, 2, sono mappe lineari. Ora mostriamo cheρ2(g) e H-equivariante, e quindi, per ipotesi, e zero. Segue allora che ρ(g)w1 = (ρ1(g)w1, 0) ∈W1 come desiderato.

Per mostrare che ρ2(g) e H-equivariante, si noti che per ogni h ∈ H, g ∈ G e w1 ∈ W1:

τ(h)(ρ(g)w1) = τ(h)(ρ1(g)w1, ρ2(g)w1) = (τ(h)(ρ1(g)w1), τ(h)(ρ2(g)w1)),

dove per la seconda ugualizanza si usa che τ(h)Wi ⊂ Wi, quindi τ(h)(ρ1(g)w1) ∈ W1,τ(h)(ρ2(g)w1) ∈ W2. D’altra parte, poiche τ(h) e ρ(g) commutano, troviamo:

τ(h)(ρ(g)w1) = ρ(g)(τ(h)w1) = (ρ1(g)(τ(h)w1), ρ2(g)(τ(h)w1)),

dove per la seconda ugualianza si usa che τ(h)w1 ∈ W1. Quindi abbiamo verificatoche τ(h)(ρ2(g)w1) = ρ2(g)(τ(h)w1), per ogni w1 ∈ W1 e ogni h ∈ H, percio ρ2(g) ∈HomH(W1,W2). 2

3.1.7 Esempio. Sia W = T 2V , H = S2 = e, g e W1 = S2V , W2 = A2V come in3.1.3. Allora per f ∈ HomH(W1,W2) si ha f(ρ(g)w1) = f(w1) per ogni w1 ∈ S2V , mentreρ(g)f(w1) = −f(w1) perche f(w1) ∈ A2V . Quindi f(w1) = 0 per ogni w1 ∈ W1 e percioHomH(W1,W2) = 0.

Page 48: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 48

3.2 I funtori di Schur

3.2.1 La decomposizione intrinseca di TmV . Sullo spazio vettoriale W = TmV , ci sonole rappresentazioni ρ : GL(V )→ GL(W ) e τ : Sm → GL(W ) che commutano (vedi 3.1.2). Lateoria delle rappresentazioni di Sm (vedi 2.4.4) da una decomposizione intrinseca:

TmV = ⊕λWλ, con Wλ∼= V nλ

λ

dove λ varia nell’insieme delle partizioni di m e Vλ e la rappresentazione irriducibile di Sm checorrisponde alla partizione λ.

Poiche le rappresentazioni irriducibili Vλ e Vµ sono isomorfe se e solo se λ = µ, il Lemma diSchur implica (vedi 3.2.3):

HomSm(V nλλ , V nµ

µ ) = 0 (λ 6= µ).

Ogni Wλ := V nλλ e allora GL(V )-invariante per il Lemma 3.1.6.

3.2.2 Esempio. Poiche conosciamo i caratteri irriducibili di S3 e non e difficile trovare ilcarattere χ = χτ della rappresentazione τ : S3 → T 3V , si calcola facilmente le molteplicitanλ = (χ, χλ) delle rappresentazioni irriducibili Vλ in T 3V .

Anzitutto, χ(e) = dimT 3V = n3 dove n = dimV . Sia e1, . . . , en una base di V . Se g ∈ S3,allora g(e1 ⊗ e2 ⊗ e3) = eg−1(1) ⊗ eg−1(2) ⊗ eg−1(3), quindi g permuta questi vettori di base diT 3V . Percio la matrice τ(g) ha tutti i coefficienti uguali a zero, tranne τ(g)ij = 1 se g manda ilj-esimo vettore di base di T 3V nel’i-esimo vettore di base. Percio χ(g) = Tr(τ(g)) e uguale alnumero dei vettori di base di T 3V fissati da g. Se g = (12) allora g fissa esattamente i vettoridi base di tipo ei ⊗ ei ⊗ ej, con 1 ≤ i, j ≤ n, quindi χ((12)) = n2. In modo simile, g = (123),fissa esattamente gli ei ⊗ ei ⊗ ei, quindi χ((123)) = n.

Sia per esempio λ = (2, 1), allora a questa partizione di 3 corrisponde la rappresentazioneirriducibile due dimensionale di S3 che ha carattere χ2,1(g) = 2, 0,−1 per g = e, (12), (123)rispettivamente (vedi 2.2.9). Quindi otteniamo:

n2,1 = (χ, χ2,1) =1

6(n3 · 2 + 3 · n2 · 0 + 2 · n · (−1)) =

n3 − n3

.

Si veda 3.2.10 per un altro modo di ottenere queste molteplicita. E’ un esercizio per il lettoreverificare le formule per le molteplicita nλ (= dimSλV ) date in 3.2.10 nel caso n = 3, 4.

3.2.3 Le applicazioni Sm-equivarianti. Studiamo lo spazio HomSm(V nλλ , V

nµµ ) in maggior

detaglio, in particolare nel caso λ = µ.Sia

f : V nλλ −→ V nµ

µ

Sm-equivariante. Allora f = (f1, . . . , fnµ) con fi : V nλλ → Vµ. Poiche ogni coppia di Vµ e

Sm-invariante, ogni fi e Sm equivariante. In piu, poiche f e lineare, per v1, . . . , vnλ ∈ Vλ si ha

fi(v1, . . . , vnλ) = fi(v1, 0 . . . , 0) + . . .+ fi(0, . . . , 0, vnλ).

Page 49: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 49

Per ogni i, j l’applicazione

fij : Vλ −→ Vµ, v 7−→ fi(0, . . . , 0, v, 0, . . . , 0)

(con v nella j-esima posizione) e Sm equivariante. Se λ 6= µ allora, per il Lemma di Schur, ognifij = 0. Se invece λ = µ, ogni fij e uno scalare, quindi f = (fij) e data da una matrice nλ×nλ,cioe:

HomSm(V nλλ , V nλ

λ ) ∼= M(nλ,C).

In particolare, poiche ogni Wλ = V nλλ e GL(V )-invariante e l’azione di ogni A ∈ GL(V ) e

Sm-equivariante, otteniamo una rappresentazione

ρλ : GL(V ) −→ GL(nλ,C),

che risulta essere irriducibile, vedi il Teorema 3.2.6. Questa rappresentazione, indicata con SλV ,e determinata da V e dalla partizione λ di m. La rappresentazione SλV di GL(V ) e contenutain TmV , ma poiche la sua molteplicita non e uno, tranne per λ = (m) e λ = (1, 1, . . . , 1),non c’e in generale un modo intrinseco di ottenere SλV come sottospazio di TmV . Usando ilsimmetrizzatore di Young cλ di λ (che dipende da una scelta di inserire i numeri 1, . . . ,m neldiagramma di Young e dalla scelta dell’azione di Sm su TmV a sinistra o a destra, che non ela stessa per tutti gli autori) si puo mostrare che SλV ∼= cλT

mV . Questa sara la definizionedi SλV qui sotto, ma vale la pena di ricordare (vedi 3.3.1 per esempio) che in generale ci sonoaltre applicazione GL(V )-equivarianti SλV → TmV .

3.2.4 Il funtore di Schur. La rappresentazione di Sm su TmV da, per ‘estensione C-lineare’,un omomorfismo di C-algebre

C[Sm] −→ End(TmV ),

x =∑g

ageg 7−→ [v1 ⊗ v2 ⊗ . . .⊗ vm 7−→∑g

agvg−1(1) ⊗ vg−1(2) ⊗ . . .⊗ vg−1(m)].

Sia λ = (m1, . . . ,mr) una partizione di m e sia cλ ∈ C[Sm] il simmetrizzatore di Youngassociato a λ (vedi 2.4.3). Definiamo il sottospazio SλV di TmV nel modo seguente:

SλV := cλTmV (= im(cλ : Tm −→ TmV )).

In questo modo assegnamo ad ogni spazio vettoriale V uno spazio vettoriale SλV : questaassegnazione si chiama il funtore di Schur (definito da λ). Si noti che data un’applicazionelineare f : V → W si ottiene un’applicazione indotta SλV → SλW , che e indicata con Sλ(f).

Il sottospazio vettoriale SλV di TmV e GL(V )-invariante perche l’azione di GL(V ) commutacon quella di Sm.

3.2.5 Il sottospazio (SλV ) ⊗ Vλ di TmV . Il Teorema 2.4.4 mostra che Vλ := C[Sm]cλ euna rappresentazione irriducibile di Sm. Poiche il simmetrizzatore di Young soddisfa c2

λ = kλcλ([FH], Theorem 4.3), per un intero kλ ( 6= 0), si ha cλ(SλV ) = SλV . Scrivendo f = cλg, si vedeche cλf = kλf per ogni f ∈ SλV .

Page 50: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 50

Siano g1 = e, . . . , gnλ ∈ Sm tali che gli gicλ sono una base di Vλ e sia f1, . . . , fmλ una basedi SλV :

SλV = ⊕nλi=1Cfi, Vλ = ⊕mλj=1Cgjcλ.

Si puo mostrare che l’applicazione

(SλV )⊗ Vλ −→ TmV, fi ⊗ (gjcλ) 7−→ gjcλfi = kλgj(fi)

e iniettiva. Quindi la sua immagine e una rappresentazione di Sm che e isomorfa a V mλλ ed e

una rappresentazione di GL(V ) isomorfa a (SλV )nλ . In questo modo si ottiene ([FH], Theorem6.3(2), Lemma 6.22 e Exercise 6.30):

3.2.6 Teorema. La decomposizione di TmV in sottorappresentazioni irriducibili per il gruppoGL(V )× Sm e data da:

TmV ∼=⊕λ

(SλV )⊗ Vλ

dove λ percorre le partizioni di m, SλV e una rappresentazione irriducibile di GL(V ) e Vλ e larappresentazione irriducibile di Sm definita da λ.

Si hanno in particolare le decomposizioni, in rappresentazioni irriducibili per Sm e GL(V )rispettivamente:

TmV ∼=⊕λ

V nλλ∼=⊕λ

(SλV )mλ , nλ := dimSλV, mλ = dimVλ.

3.2.7 Esempio: m = 2. Nel caso m = 2, le partizioni sono 2 = 2 e 2 = 1 + 1. Le duerappresentazioni irriducibili di S2 hanno dimensione 1: Vλ ∼= C, percio (SλV ) ⊗ Vλ ∼= SλV .Otteniamo allora la decomposizione

V ⊗ V ∼= S2V ⊕ S1,1V, S2V ∼= S2V, S1,1V ∼= ∧2V,

che e quella dell’Esempio 3.1.3. Infatti, si ha (vedi 2.4.5):

c2(v1 ⊗ v2) = (1 + (12))(v1 ⊗ v2) = v1 ⊗ v2 + v2 ⊗ v1 = 2v1 v2,

e similmente,

c1,1(v1 ⊗ v2) = (1− (12))(v1 ⊗ v2) = v1 ⊗ v2 − v2 ⊗ v1 = 2v1 ∧ v2.

3.2.8 Il prodotto alternante in TmV . L’applicazione canonica

Ψ : TmV −→ ∧mV, v1 ⊗ v2 ⊗ . . .⊗ vm 7−→ v1 ∧ v2 ∧ . . . ∧ vm,

ristretta a S(1,1,...,1)V induce un isomorfismo

S(1,1,...,1)V = cλTmV

∼=−→ ∧mV,

Page 51: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 51

per v1 ⊗ v2 ⊗ . . . vm ∈ TmV e λ = (1, 1, . . . , 1) si ha:

cλ(v1 ⊗ v2 ⊗ . . .⊗ vm) =∑g∈Sm

ε(g)vg(1) ⊗ vg(2) ⊗ . . .⊗ vg(m)Ψ7−→ (m!)(v1 ∧ v2 ∧ . . . ∧ vm).

Si noti che se dimV < m, si ha S1,1,...,1V = ∧mV = 0. In generale si ha (vedi 3.2.11):

SλV = 0 se λ = (m1,m2, . . . ,mr) e dimV < r.

3.2.9 Il prodotto simmetrico in TmV . Il sottospazio SmV di TmV e detto l’m-esimoprodotto simmetrico di V ed e scritto SmV . Per v1, . . . , vm ∈ V si definisce il loro prodottosimmetrico, che sta in SmV , come

v1 v2 . . . vm := (m!)−1cm(v1 ⊗ v2 ⊗ . . .⊗ vm) = (m!)−1∑g∈Sm

vg(1) ⊗ vg(2) ⊗ . . .⊗ vg(m).

Si noti che v1 . . .vm e l’immagine di v1⊗ . . .⊗vm mediante il proiettore Π sullo spazio degliinvarianti (vedi 2.2.6). In particolare, per ogni g ∈ Sm si ha:

v1 v2 . . . vm = vg(1) vg(2) . . . vg(m).

Sia e1, . . . , en una base di V , allora una base di SmV e data dalle

ei1 ei2 . . . eim con i1 ≤ i2 ≤ . . . ≤ im.

In modo simile a 1.3.3, ma considerando applicazioni simmetriche invece di applicazionialternanti, si possono definire i sottospazi Ik di T kV nel modo seguente:

I2 = 〈. . . , v1 ⊗ v2 − v2 ⊗ v1, . . .〉v1,v2∈V , Ik = Ik−1 ⊗ V ⊕ V ⊗ Ik−1 (⊂ T kV ).

Allora si ha v1 ⊗ v2 = v2 ⊗ v1 in T 2V/I2 e poi v1 ⊗ . . .⊗ vm = vg(1) ⊗ . . .⊗ vg(m) in TmV/Imper ogni g ∈ Sm. In particolare,

v1 ⊗ v2 ⊗ . . .⊗ vm = v1 v2 . . . vm (∈ TmV/Im).

Si puo mostrare che TmV/Im ∼= SmV e spesso si scrive (come anche per il prodotto ‘∧’)semplicemente v1 v2 . . . vm per l’elemento v1 v2 . . . vm di TmV/Im.

La struttura di algebra su T (V ) = ⊕mTmV (vedi 1.3.3) induce una struttura di algebrasu S∗V := TV/I, dove I = I2 ⊕ I3 ⊕ . . ., detta l’algebra simmetrica generata da V . Si ha unisomorfismo tra l’algebra simmetrica su V e l’anello dei polinomi in n = dimV variabili:

S∗V =∞⊕m=0

SmV∼=−→ C[x1, . . . , xn], ei1 ei2 . . . eim 7−→ xi1xi2 . . . xim .

Page 52: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 52

3.2.10 La dimensione di SλV . Sia λ = (m1,m2, . . . ,mr) una partizione di m. Allora siha la seguente formula per la dimensione dello spazio vettoriale SλV ([FH], Theorem 6.3(1) eExcercise 6.4):

dimSλV =∏i,j

n− i+ j

hij, n = dimV,

il prodotto e sugli m = m1+. . .+mr quadrati nel diagramma di Young di λ e hij e il ‘hooklength’del quadrato nel i-esima riga e j-esima colonna hij (vedi 2.4.6).

Qualche esempio:

λ = 3 11

, µ = 3 22 1

, ρ =. . .. . . .m m−1 2 1

Se λ = (2, 1) ci sono tre quadrati con (i, j) = (1, 1), (1, 2), (2, 1) e hij e come indicato neldiagramma, quindi:

dimS2,1V =(n− 1 + 1)(n− 1 + 2)(n− 2 + 1)

3 · 1 · 1=

(n+ 1)n(n− 1)

3=n(n2 − 1)

3.

Se µ = (2, 2) ci sono quattro quadrati con (i, j) = (1, 1), (1, 2), (2, 1), (2, 2) e quindi:

dimS2,2V =(n− 1 + 1)(n− 1 + 2)(n− 2 + 1)(n− 2 + 2)

3 · 2 · 2 · 1=n2(n2 − 1)

12.

Se ρ = (m), allora ci sono m quadrati con (i, j) = (1, 1), (1, 2), . . . , (1,m) e:

dimSmV = dimSmV =(n− 1 + 1)(n− 1 + 2) · · · (n− 1 +m)

m(m− 1) · · · 1=(m+n−1

m

),

che e un coefficiente binomiale. Similmente, si calcola:

dimS3,1 =(n+ 2)(n+ 1)n(n− 1)

8, dimS2,1,1 =

(n+ 1)n(n− 1)(n− 2)

8,

e si verifica che dimS1,1,...,1V = dim∧mV = (nm).

3.2.11 L’operatore bλ. In generale, non e facile identificare il sottospazio SλV = cλTmV di

TmV . Si ricordi (vedi 2.4.3) che cλ = aλbλ e che bλ e dato da:

bλ :=∑g∈Q

ε(g)eg, Q = Sµ1 × Sµ2 × . . .× Sµs ,

dove µi e il numero dei quadrati nella i-esima colonna del diagramma di Young di λ. Si notiche µ1 = r, il numero delle righe. Cioe ogni g ∈ Q e un prodotto g1g2 · · · gs = gsgs−1 · · · g1,

Page 53: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 53

in modo unico, di permutazioni gj ∈ Sµj , e gj permuta soltanto i numeri nei quadrati nellaj-esima colonna. Questo ci permette di scrivere:

bλ :=( ∑gs∈Sµs

ε(gs)egs

)( ∑gs−1∈Sµs−1

ε(gs−1)egs−1

)· · ·( ∑g1∈Sµ1

ε(g1)eg1

).

Poiche i numeri nella prima colonna sono 1, 2 . . . , µ1, si ha:( ∑g1∈Sµ1

ε(g1)eg1

)(V ⊗ . . .⊗ V )︸ ︷︷ ︸

m

= (∧µ1V )⊗ (V ⊗ . . .⊗ V )︸ ︷︷ ︸m−µ1

.

In questo modo, si ottiene:

bλ(TmV ) = (∧µ1V )⊗ (∧µ2V )⊗ . . .⊗ (∧µsV ) (⊂ TmV ).

Si noti che bλ(TmV ) = 0 se uno dei ∧µjV = 0, cioe se µj > dimV . Poiche µ1 ≥ µ2 ≥ . . . ≥ µs

e µ1 = r, bλ(TmV ) = 0 se r > dimV . In tal caso anche SλV = aλbλ(T

mV ) = 0.

3.2.12 Una base di SλV e diagrammi di Young. Sia e1, . . . , en una base di V , alloraesiste un modo efficiente per trovare una base di SλV . Sia λ una partizione di m e sia n =dimV . Esiste una base di SλV tale che i vettori di base sono in corrispondenza biunivoca coni ‘tableau semistandard’ di Young ([FH], Problem 6.15∗). Un tableau semistandard di Younge il diagramma di Young di λ dove in ogni quadrato compare un intero dell’insieme 1, . . . , nin modo tale che i numeri in ogni colonna siano in ordine strettamente crescente (ai+k,j > ai,jse ai,j e l’intero nel quadrato nell’i-esima riga e j-esima colonna) mentre gli interi in ogni rigasiano in ordine non-decrescente (ai,j+k ≥ ai,j). La prima condizione corrisponde al fatto cheSλV ⊂ (∧µ1V )⊗ . . .⊗ (∧µsV ).

Per esempio, gli otto vettori di base di S2,1V , con dimV = 3 corrispondono ai seguentitableau semistandard:

1 12

, 1 13

, 2 23

, 1 22

, 1 33

, 2 33

, 1 32

, 1 23

.

3.3 Esempi: T 3V e T 4V .

3.3.1 La decomposizione di T 3V . Sia m = 3. Ci sono tre partizioni di 3: 3, 2 + 1, 1 + 1 + 1e le rappresentazioni corrispondenti di S3 hanno dimensione 1, 2, 1 rispettivamente. Percio ilTeorema 3.2.6, insieme a 3.2.9 e 3.2.8, ci da:

V ⊗ V ⊗ V ∼= S(3)V ⊕ (S2,1V )2 ⊕ S1,1,1V ∼= S3V ⊕ (S2,1V )2 ⊕ ∧3V.

La rappresentazione S2,1V di GL(V ) e l’immagine del simmetrizzatore di Young c2,1 : T 3V →T 3V . Si ha (vedi 2.4.5):

c2,1 = a2,1b2,1 = (ee + e(13))(ee − e(12)) = ee + e(13) − e(12) − e(123).

Page 54: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 54

Si noti che

b2,1(v1 ⊗ v2 ⊗ v3) = v1 ⊗ v2 ⊗ v3 − v2 ⊗ v1 ⊗ v3 = 2(v1 ∧ v2)⊗ v3.

Quindi, come abbiamo gia visto in generale in 3.2.11,

imb2,1 = (∧2V )⊗ V.

Ora si ha: S2,1V = a2,1(b2,1T3V ) = a2,1((∧2V )⊗ V ). Con a2,1 = e+ e(13) si calcola:

(e+ e(13))(v1⊗ v2⊗ v3− v2⊗ v1⊗ v3)) = v1⊗ v2⊗ v3− v2⊗ v1⊗ v3 + v3⊗ v2⊗ v1− v3⊗ v1⊗ v2,

quindic2,1(v1 ⊗ v2 ⊗ v3) = 2(v1 ∧ v2)⊗ v3 + 2v3 ⊗ (v2 ∧ v1).

In particolare, S2,1V non e contenuto in (∧2V )⊗ V . Posto

(S2V )13 ⊗ V := 〈w1 ⊗ w2 ⊗ w3 + w3 ⊗ w2 ⊗ w1 : wi ∈ V 〉 (⊂ T 3V ),

si ha che S2,1V ⊂ (S2V )13 ⊗ V . Per capire meglio come e fatto lo spazio S2,1V , si noti chel’applicazione data dal simmetrizzatore c3 : T 3V → S3V , v1 ⊗ v2 ⊗ v3 7→ v1 v2 v3 (vedi3.2.9) ristretto a (S2V )13 ⊗ V manda ogni elemento del sottospazio S2,1V di T 3V in zero:

c3(c2,1(v1 ⊗ v2 ⊗ v3)) = c3(v1 ⊗ v2 ⊗ v3 − v2 ⊗ v1 ⊗ v3 + v3 ⊗ v2 ⊗ v1 − v3 ⊗ v1 ⊗ v2)= v1 v2 v3 − v2 v1 v3 + v3 v2 v1 − v3 v1 v2

= 0.

Usando la formula per la dimensione degli SλV mostriamo che

S2,1V = ker(Ψ : (S2V )13 ⊗ V −→ S3V ).

E facile vedere che Ψ e suriettiva, quindi

dim ker(Ψ) = dim((S2V )13 ⊗ V )− dimS3V =(n+1

2

)n−

(n+2

3

)=n(n2 − 1)

3= dimS2,1V,

e percio ker(c3) = S2,1V .Si noti che t 7→ (23)t da un isomorfismo (che commuta con l’azione di GL(V )):

(S2V )13 ⊗ V ∼= (S2V )⊗ V := 〈(w1 w3)⊗ w2 = w1 ⊗ w3 ⊗ w2 + w3 ⊗ w1 ⊗ w2 : wi ∈ V 〉.

In generale si ha (vedi [FH], p.79) che Sd,1 ∼= ker((SdV )⊗ V → Sd+1V ).

3.3.2 Una base di S2,1V . Non e difficile verificare la formula per la dimensione di S2,1V .Sia e1, . . . , en una base di V . Una base di T 3V e data dagli eijk := ei ⊗ ej ⊗ ek. QuindiSλV = c2,1T

3V , con c2,1 = ee − e12) + e(13) − e(123) e generato dagli

fijk := c2,1eijk = eijk − ejik + ekji − ekij (eijk := ei ⊗ ej ⊗ ek).

Page 55: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 55

Si verifica facilmente che:

fijk = −fjik, fikj = −fkij, fjki = −fkji, fijk + fkij + fjki = 0.

In particolare, fijk = 0 se i = j = k (infatti, eiii ∈ S3V ). L’immagine del sottospazio tridi-mensionale di T 3V generato da eiij, eiji, ejii, con i 6= j, ha dimensione uno ed e generato dafiji = −fjii perche c2,1eiij = 0. Se i, j, k sono distinti, l’immagine del sottospazio sei dimension-ale generato dai eσ(i)σ(j)σ(k), dove σ varia tra le permutazioni di i, j, k, ha dimensione due.Una base dell’immagine e data da fijk e fikj. Il numero di vettori di base e allora facile dacontare:

dimS2,1V = n(n− 1) + 2 (n3 ) =n(n2 − 1)

3.

Nel caso n = 3, la corrispondenza tra i tableau semistandard di 3.2.12 e i vettori di basefijk e data da

i kj

←→ c2,1(ei ⊗ ej ⊗ ek) = fijk.

3.3.3 Lo spazio S2,1V e tensori alternanti. Come osservato prima, il sottospazio Wλ∼=

V nλλ∼= (SλV )⊗Vλ e definito in modo intrinseco da TmV , mentre il sottospazio SλV dipende da

varie scelte non intrinseche. Per ogni x ∈ C[Sm], la molteplicazione per x da un’applicazioneGL(V )-equivariante SλV → xSλV . Poiche SλV e una rappresentazione irriducibile per GL(V ),se xSλV 6= 0, quest’applicazione e un isomorfismo.

Consideriamo per esempio λ = (2, 1) e x = ee − e(12) ∈ C[S3]. Usando:

e(12)(c21(v1 ⊗ v2 ⊗ v3)) = v2 ⊗ v1 ⊗ v3 − v1 ⊗ v2 ⊗ v3 + v2 ⊗ v3 ⊗ v1 − v1 ⊗ v3 ⊗ v2,

otteniamo che

(ee − e(12))(c21(v1 ⊗ v2 ⊗ v3)) = 2(v1 ∧ v2)⊗ v3 − (v2 ∧ v3)⊗ v1 − (v1 ∧ v3)⊗ v2,

e quindiS2,1∼= (ee − e(12))S2,1 ⊂ (∧2V )⊗ V.

Una certa combinazione lineare di questi elementi e piu semplice:

xc2,1(v1 ⊗ v2 ⊗ v3 − v1 ⊗ v3 ⊗ v2) = 3((v1 ∧ v2)⊗ v3 + (v1 ∧ v3)⊗ v2).

Si verifica che l’applicazione naturale Ψ : T 3V → ∧3V , data da Ψ(v1 ⊗ v2 ⊗ v3) = v1 ∧ v2 ∧ v3,manda ogni elemento del sottospazio (ee − e(12))S2,1 di T 3V in zero ed e suriettiva. Quindi

dim ker(Ψ) = dim((∧2V )⊗ V )− dim∧3V = (n2 )n− (n3 ) =n(n2 − 1)

3= dimS2,1V,

e percio ([FH], p.76)S2,1V ∼= ker(Ψ : (∧2V )⊗ V −→ ∧3V ).

Page 56: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 56

In generale, S2,1,...,1V ∼= ker(∧m−1V ⊗ V −→ ∧mV ) ([FH], p.79).Nel libro [FH] p.76, lo spazio S2,1V e definito usando un certo simmetrizzatore di Young e

l’azione a destra, e il loro spazio e generato dalle

v1 ⊗ v2 ⊗ v3 + v2 ⊗ v1 ⊗ v3 − v3 ⊗ v2 ⊗ v1 − v3 ⊗ v1 ⊗ v2 ∈ (∧2V )13 ⊗ V,

cioe, questi generatori sono antisimmetrici rispetto all’azione di (13). E’ facile vedere che lospazio generato da questi elementi e (23)xc2,1T

3V ⊂ (SλV ) ⊗ Vλ, e quindi e isomorfo, comerappresentazione di GL(V ), al nostro spazio SλV .

3.3.4 La decomposizione di T 4V . Sia m = 4, ci sono cinque partizioni di 4:(4), (3, 1), (2, 2), (2, 1, 1), (1, 1, 1, 1) e le rappresentazioni corrispondenti di S4 hanno dimensione1, 3, 2, 3, 1 rispettivamente. Percio il Teorema 3.2.6, in combinazione con 3.2.9 e 3.2.8, si da:

V ⊗ V ⊗ V ⊗ V ∼= S4V ⊕ (S3,1V )3 ⊕ (S2,2V )2 ⊕ (S2,1,1V )3 ⊕ ∧4V.

Consideriamo il sottospazio S2,2 = c2,2T4V di T 4V . Come nell’esempio 3.3.1 si ha:

b2,2T4V = (∧2V )⊗ (∧2V ) ⊂ (V ⊗ V )⊗ (V ⊗ V ).

In questo caso non e facile descrivere a2,2(b2,2T4V ). Visto che a2,2 = (ee + e(13))(ee + e(24)) si

ha:a2,2T

4V = (S2V )13 ⊗ (S2V )24 ⊂ V ⊗ V ⊗ V ⊗ V,

quindi S2,2V = a2,2(b2,2T4V ) ⊂ (S2V )13 ⊗ (S2V )24. Poiche l’azione di S4 commuta con quella

di GL(V ), lo spazio (23)S2,2V e isomorfo, come rappresentazione di GL(V ) a S2,2 e si ha:

S2,2V ∼= (23)S2,2V ⊂ (S2V )⊗ (S2V ) ⊂ (V ⊗ V )⊗ (V ⊗ V ).

Si ha una decomposizione di GL(V )-rappresentazioni:

(S2V )⊗ (S2V ) ∼= S2(S2V ) ⊗ ∧2(S2V ).

Un elemento di (S2V )⊗ (S2V ) e una combinazione lineare di tensori del tipo:

(ei ej)⊗ (ek el) = fijkl + fjikl + fijlk + fjilk ⊂ (S2V )⊗ (S2V )

dove gli ei sono una base di V e fijkl = ei ⊗ ej ⊗ ek ⊗ el. Poi un elemento in S2(S2V ) ecombinazione lineare di tensori del tipo:

gijkl := (ei ej)⊗ (ek el) + (ek el)⊗ (ei ej) ⊂ S2(S2V ).

Lasciamo al lettore il piacere di verificare che

(23)c2,2(fijkl) = gikjl − gjkil (∈ S2(S2V )).

Quindi l’immagine dell’applicazione (23)c2,2 : T 4V → T 4V e contenuta in S2(S2V ) e percio(23)S2,2V ⊂ S2(S2V ).

Page 57: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

3 TENSORI E GRUPPO SIMMETRICO 57

La restrizione dell’applicazione

c4 : T 4V −→ S4V, fijkl 7−→ ei ej ek el

a S2(S2V ) manda gikjl − gjkil nello 0 ed e suriettiva. Calcolando le dimensioni si vede che

S2,2V ∼= (23)S2,2V = ker(c4 : S2(S2V ) −→ S4V ),

infatti

dimS2(S2V )− dimS4V = (n(n+1)/2)n(n+1)/2+12

− (n+3)(n+2)(n+1)n24

=n(n+1)(3(n(n+1)+2)−(n+3)(n+2))

24

= n2(n2−1)12

= dimS2,2V.

3.3.5 La rappresentazione S2,2V e S2(∧2V ). Per la geometria riemanniana c’e un’altracopia della GL(V )-rappresentazione S2,2 in T 4V che e di grande interesse (vedi [FH], Exc. 23.38,p.427). Si ricordi che S2,2V ⊗ V2,2

∼= S22,2 ⊂ T 4V , e che in 3.3.4 abbiamo visto che ci sono le

due copie S2,2V := c2,2T4V e (23)S2,2V = e23S2,2, quindi ogni altra copia di S2,2V in T 4V e

ottenuta come (aee + be(23))S2,2V per certi a, b ∈ C.Ora consideriamo il sottospazio

S2(∧2V ) → (∧2V )⊗ (∧2V ).

Se le ei sono una base di V , questo spazio e generato dalle

hijkl := (ei ∧ ej) (ek ∧ el) = fijkl − fjikl − fijlk + fijlk + fklij − flkij − fklji + flkji.

dove fijkl = ei ⊗ ej ⊗ ek ⊗ el. Lasciamo verificare al lettore che

2c22fijkl + (13)c2,2fijkl = 2hijkl + hikjl − hiljk ∈ S2(∧2V ).

Percio S2(∧2V ) contiene (2ee + e(23))S2,2, che e una copia di S2,2. Si verifica anche, usando3.2.10, che

S2,2V ∼= (2ee + e(23))S2,2V = ker(c4 : S2(∧2V ) −→ ∧4V ).

Page 58: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 58

4 Geometria differenziale

Testi consigliati: [dC], [D], [DNF1], [DNF2], [T], [Wa].

4.1 Richiami di analisi.

4.1.1 Diffeomorfismi. Sia U ⊂ Rm un sottoinsieme aperto. L’algebra delle funzioni lisce suU si indica con C∞(U). Sia

F = (F1, F2, . . . , Fn) : U −→ Rn

un’applicazione liscia, cioe ogni Fi : U → R e in C∞(U). Un’applicazione liscia F : U → V :=F (U) (⊂ Rn) e detta diffeomorfismo su U se esiste una mappa liscia G : V → U tale cheF G = idF (U) e G F = idU . In tal caso si ha m = n.

La matrice jacobiana di F in p ∈ U e la matrice n×m definita da:

Jp(F ) =

(∂F1/∂t1)(p) . . . (∂F1/∂tm)(p)...

...(∂Fn/∂t1)(p) . . . (∂Fn/∂tm)(p)

(∈Mn,m(R)),

dove le ti sono le coordinate su Rm. Per x ∈ Rm, il vettore Jp(F )x ∈ Rn e dato da:

Jp(F )x = (dF (p+ tx)/dt)|t=0,

quindi Jp(F ) determina il comportamento di F ‘vicino’ a p. Per esempio si ha:

4.1.2 Teorema della funzione inversa. Sia U un aperto in Rm e sia F : U → Rm

un’applicazione liscia. Supponiamo che la matrice jacobiana Jp(F ) sia invertibile in un puntop ∈ U . Allora esiste un intorno aperto U ′ di p tale che F (U ′) e aperto e che l’ applicazioneF|U ′ : U ′ → F (U ′) e un diffeomorfismo.

4.2 Varieta differenziabili

4.2.1 Definizione di varieta. Sia M uno spazio topologico non-vuoto di Hausdorff. Unacarta locale di M e una coppia (U, φ) dove U ⊂ M e un aperto e φ : U → φ(U) (⊂ Rm) e unomeomorfismo. Due carte locali (U, φ), (V, ψ) sono dette compatibili se

φ ψ−1 : ψ(U ∩ V ) −→ φ(U ∩ V )

e un diffeomorfismo. Si noti che in tal caso anche (φ ψ−1)−1 = ψ φ−1 e un diffeomorfismo.Un atlante di M e una collezione (Ui, φi)i∈I di carte locali compatibili tale che M = ∪i∈IUi.

Se M e connesso segue che il numero intero m non dipende della carta dell’ atlante ed e dettodimensione di M .

Page 59: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 59

Sia A = (Ui, φi)i∈I un atlante di M e sia (V, ψ) una carta locale compatibile con tutte le(Ui, φi). Allora anche (Ui, φi)i∈I ∪ (V, ψ) e un atlante di M .

Prendendo quindi l’unione di tutte le carte compatibili con un atlante dato, otteniamo unatlante massimale, cioe un atlante che non e propriamente contenuto in nessun altro atlante.In particolare, ogni atlante di M e contenuto in un unico atlante massimale.

Una varieta differenziabile e una coppia (M,A) dove M e uno spazio topologico non-vuotodi Hausdorff ed A e un atlante massimale di M . Si richiede inoltre che la topologia di X sia abase numberabile, condizione tecnica verificata per gli esempi considerati in queste note.

Un esempio di varieta e lo spazio vettoriale Rn, con la topologia euclidea, con l’atlantemassimale definito dall’atlante, con una sola carta locale, (Rn, idRn). Un sottoinsieme apertoU di una varieta M , con le restrizioni delle carte locali di M ad U , e una varieta.

Sia (U, φ) una carta di M . Si noti che per ogni diffeomorfismo δ : φ(U)→ δ(φ(U)) ⊂ Rm,anche (U, δ φ) e una carta di M . In particolare, se p ∈ U e δ(x) = x − φ(p), la carta locale(U, ψ := δ φ) soddisfa ψ(p) = 0.

4.2.2 Applicazioni lisce. Siano M,N varieta differenziabili di dimensione m ed nrispettivamente. Sia

f : M −→ N

un’applicazione continua. L’applicazione f e detta liscia in p ∈ M se per ogni carta (U, φ) diM , con p ∈ U , e ogni carta (V, ψ) di Y , con f(p) ∈ V , l’applicazione

ψ f φ−1 : φ(U ∩ f−1(V )) −→ ψ(V ) (⊂ Rn)

e liscia in φ(p) ∈ φ(U ∩ f−1(V )) (⊂ Rm). Se scriviamo F = ψ f φ−1, allora F = (F1, . . . , Fn)e definita sull’aperto φ(U ∩ f−1(V )) di Rm che contiene φ(p) e f liscia in p vuole dire che ogniFi e liscia nel punto φ(p).

Per verificare se f e liscia in p ∈ M basta verificarlo per una sola carta (U, φ) e una solacarta (V, ψ) perche se (U ′, φ′), (V ′, ψ′) sono altre carte, si ha:

ψ′ f (φ′)−1 = (ψ′ ψ−1) ψ f φ−1 (φ (φ′)−1).

Poiche le mappe ψ′ ψ−1, φ (φ′)−1 sono diffeomorfismi, e per ipotesi ψ f φ−1 e liscia, segueche l’applicazione ψ′ f (φ′)−1 e liscia.

L’applicazione f e detta liscia se e liscia in ogni p ∈M . E’ facile verifcare che la composizionedi due applicazioni liscie e liscia.

4.2.3 Funzioni lisce. Un caso particolare di applicazioni lisce sono quelle della forma

f : V −→ R

dove V e un aperto in una varieta M . L’algebra delle funzioni lisce su V e denotato con C∞(V ).Un esempio importante di funzioni lisce e quello delle funzioni coordinate di una carta. Sia

(U, φ = (x1, . . . , xm)) una carta di M , allora xi ∈ C∞(U), per ogni i = 1, . . . ,m, perche se(t1, . . . , tm) = φ(p) ∈ φ(U) ⊂ Rm allora:

(xi φ−1)(t1, . . . , tm) = xi(p) = ti

Page 60: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 60

e la funzione (t1, . . . , tm) 7→ ti e ovviamente liscia.

4.2.4 Il rango di una mappa liscia. Sia f : M → N una mappa liscia tra varieta didimensione m e n rispettivamente. Sia p ∈M e siano (U, φ), (V, ψ) carte di M e N con p ∈ U ef(p) ∈ V . Allora F = (F1, . . . , Fn) := ψ f φ−1 e una mappa liscia su un intorno di φ(p) ∈ Rm

e la sua matrice jacobiana in φ(p) e:

Jφ(p)(F ) :=(

(∂Fi/∂tj)(φ(p)))

dove t1, . . . , tm sono le coordinate su Rm.Il rango di f in p e definito come il rango della matrice Jφ(p)(F ).Questa definizione non dipende dalle scelta delle carte. Se invece di F consideriamo G =

β F α dove α e β sono diffeomorfismi locali, allora, poiche J(G) = J(β)J(F )J(α) e J(β),J(α) sono applicazioni lineari invertibili, segue che il rango di J(G) e uguale a quello di J(F ).

4.2.5 Sommersioni. Sia f : M → N un’applicazione liscia tra varieta di dimensione m e nrispettivamente. L’applicazione e detta sommersione in p ∈ M se il rango di f in p e uguale an = dimN . In tal caso, dimM ≥ dimN e f ha rango massimale in p ∈M .

4.2.6 Sottovarieta. Un sottoinsieme K ⊂ M e una sottovarieta di M se per ogni p ∈ Kesiste una carta (U, φ = (x1, . . . , xn)) di M con p ∈ U e tale che

K ∩ U = q ∈M : xr+1(q) = . . . = xm(q) = 0

per qualche r, cioe, tramite l’omeomorfismo φ : U → φ(U) ⊂ Rm, l’immagine di K (piuprecisamente: di K ∩ U) e un aperto di un sottospazio lineare di Rm.

Una sottovarieta e una varieta che ha per carte gli (U ∩K, φ = (x1, . . . , xr)) con (U, φ) comesopra. Si verifica facilmente che l’inclusione i : K →M e un’applicazione liscia. In particolare,la restrizione a K di una funzione liscia su M e liscia.

Un risultato importante e il seguente teorema.

4.2.7 Teorema. Sia f : M → N e un’applicazione liscia tra varieta di dimensione m e nrispettivamente. Sia q ∈ N tale che f e una sommersione in ogni p ∈ f−1(q). Allora f−1(q) euna sottovarieta di dimensione r = m− n di M .

4.2.8 Esempio: la sfera. Sia F : Rn+1 −→ R la mappa definita da F (x) = x21 + . . .+ x2

n+1.Usando le carte locali sulle varieta Rn+1 e R che sono individuate dalle identita, si ha:

F (x) =n+1∑i=1

x2i , Jx(F ) = (2x1 2x2 . . . 2xn+1).

Quindi se x 6= 0 la matrice Jx(F ) ha rango 1 = dim R e concludiamo che F e una sommersionesull’aperto Rn+1 − 0 di Rn+1.

Page 61: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 61

Dal Teorema 4.2.7 segue allora che F−1(1) e una sottovarieta di Rn+1, quindi la sfera didimensione n e una varieta:

Sn = x ∈ Rn+1 :∑

x2i = 1 = F−1(1).

4.2.9 Esempio: il gruppo SL(n,R). Mostriamo che il gruppo delle matrici condeterminante 1 e una varieta. Sia

F = det : Mn(R) ∼= Rn2 −→ R, A = (aij) 7−→ det(A).

Per calcolare ∂ det /∂xij si sviluppi il determinante della matrice X = (xij) rispetto l’i-esimoriga:

det(X) = det(xij) =n∑j=1

(−1)i+jxij det(Xij)

dove Xij ∈Mn−1(R) e la matrice ottenuta cancellando l’i-esima riga e la j-esima colonna dellamatrice X. Poiche in questa formula xij compare soltanto davanti a det(Xij), si ha

∂ det /∂xij = (−1)i+j det(Xij).

Quindi la matrice JX(F ), con una sola riga e n2 colonne, ha rango massimale se det(Xij) 6= 0per almeno una coppia i, j. La formula qui sopra mostra inoltre che det(X) 6= 0 implica chealmeno uno delle det(Xij) e non-zero.

Quindi, per X nell’ aperto GL(n,R) di Mn(R), dato dalle matrici con det(A) 6= 0, JX(F )ha rango massimale. Percio det e un sommersione su

SL(n,R) = A ∈Mn(R) : det(A) = 1 = F−1(1).

Dal teorema segue che SL(n,R) e una varieta. La dimensione di SL(n,R) e n2 − 1.Un altro modo di mostrare che det ha rango massimale su GL(n,R) e di usare il fatto che

per una mappa liscia γ : R→Mn(R) si ha:

J0(det γ) = Jγ(0)(det)J0(γ),

dove si noti che J0(det γ) = (d/dt)(det(γ))(0) e una matrice 1 × 1. Sia X ∈ GL(n,R) edefiniamo γ(t) = (1 + t)X ∈Mn(R). allora γ(0) = X e

J0(det γ) = ((d/dt)(det((1 + t)X))|t=0

= ((d/dt)((1 + t)n det(X))|t=0

= (n(1 + t)n−1 det(X))|t=0

= n det(X) 6= 0

quindi anche Jγ(0)(det) = JX(det) 6= 0 e siccome JX(det) ha soltanto una riga, concludiamoche det ha rango massimale in X ∈ GL(n,R).

Page 62: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 62

4.2.10 Esempio: il gruppo O(n,R). Il gruppo ortogonale reale e il sottogruppo di GL(n,R)definito da

O(n,R) := A ∈Mn(R) : tAA = I ,

in particolare, per A ∈ O(n,R) si ha A−1 = tA. Per mostrare che O(n,R) e una sottovarietadi GL(n,R), definiamo prima

Symn(R) := X ∈Mn(R) : tX = X ,

cioe, Symn(R) e lo spazio vettoriale reale delle matrici n × n simmetriche. Si noti chedimSymn(R) = n(n+ 1)/2. Definiamo poi un’applicazione liscia tra spazi vettoriali:

F : Mn(R) −→ Symn(R), A 7−→ tAA,

e notiamo che O(n,R) = F−1(I). Mostriamo che F e una sommersione su F−1(I).Sia A ∈ F−1(I), dobbiamo mostrare che JA(F ) ha rango massimale, oppure, equivalen-

temente, che JA(F ) e un’applicazione suriettiva. Se consideriamo JA(F ) come matrice conn2 colonne e n(n + 1)/2 righe, allora per X ∈ Mn(R) che corrisponde a x ∈ Rn2

si ha cheJA(F )x = y ∈ Rn(n+1)/2, dove y corrisponde alla matrice simmetrica Y data da:

Y = ddλF (A+ λX)|λ=0 se y = JA(F )x.

Per A ∈ F−1(I) e X ∈Mn(R), si ha:

ddλF (A+ λX)|λ=0 = d

dλ(t(A+ λX)(A+ λX))|λ=0

= ddλ

(tAA+ λ(tAX + tXA) + λ2(tXX))|λ=0

= tAX + tXA.

Si noti che tAX+ tXA = 0 equivale a tAX = −tXA e, poiche −tXA = −t(tAX), questo equiv-ale inoltre a tAX = −t(tAX), cioe tAX e una matrice antisimmetrica. Poiche A e invertibileotteniamo un isomorfismo

ker(JA(F )) ∼= X ∈Mn(R) : tAX = −t(tAX) ∼=−→ Z ∈Mn(R) : tZ = −Z, X 7−→ tAX,

con inversa Z 7→ tA−1Z. Quindi dim ker(JA(F )) = n(n − 1)/2 per ogni A ∈ F−1(I) e perciodim im(JA(F )) = n2 − n(n − 1)/2 = n(n + 1)/2 = dimSymn(R). Concludiamo che JA(F ) harango massimale per ogni A ∈ F−1(I) e quindi che F e una sommersione su O(n,R).

Si ricordi che O(n,R) ha due componenti connesse: una e il gruppo

SO(n,R) = A ∈ O(n,R) : det(A) = 1 ,

l’altra e data dalle matrici A ∈ O(n,R) con det(A) = −1. Abbiamo mostrato che entrambesono varieta di dimensione n(n− 1)/2.

Page 63: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 63

4.3 Spazi e fibrati tangenti

4.3.1 Lo spazio tangente. Sia M una varieta differenziabile di dimensione m e sia p ∈ M .L’algebra dei germi delle funzioni lisce in p e

C∞(M, p) := (U, f)/ ∼

dove U e un intorno aperto di p e f : U → R e una funzione liscia. Per tali (U, f), (V, g) sidefinisce (U, f) ∼ (V, g) se f = g su un intorno di p. Quindi la classe, il germe, di f dipendesoltanto dal comportamento di f ‘molto vicino’ a p. Di solito scriveremo semplicemente finvece di [(U, f)] per il germe definito da (U, f).

Una derivazione su C∞(M, p) e un’applicazione

v : C∞(M, p) −→ R, t.c.

v(λf + µg) = λv(f) + µv(g),v(fg) = f(p)v(g) + g(p)v(f),

per f, g ∈ C∞(M, p) e λ, µ ∈ R, cioe v e R-lineare e soddisfa la regola di Leibnitz. L’insiemedelle derivazioni su C∞(M, p) e uno spazio vettoriale reale tramite

(λv + µw)(f) := λv(f) + µw(f) (λ, µ ∈ R, f ∈ C∞(M, p)),

dove v, w sono derivazioni su C∞(M, p). Questo spazio vettoriale e detto spazio tangente di Min p e si scrive TpM . Una derivazione in TpM si chiama vettore tangente.

Esempi di tali derivazioni si ottengono nel modo seguente. Sia (U, φ = (x1, . . . , xm) unacarta di M dove p ∈ U . Si definisce

(∂/∂xi)|p : C∞(M, p) −→ R, (∂/∂xi)|p(f) :=∂(f φ−1)

∂ti(φ(p)),

dove i ti sono coordinate su Rm. Si noti che f φ−1 e liscia su un intorno di φ(p) in Rm. E’facile verificare che (∂/∂xi)|p ∈ TpM .

4.3.2 Una base dello spazio tangente. Si puo mostrare che i (∂/∂xi)|p, 1 ≤ i ≤ m, definiticome sopra, sono una base di TpM , in particolare, dimTpM = dimM = m. Sia v ∈ TpM ,allora v =

∑ai(∂/∂xi)|p per certe ai ∈ R. Poiche xi ∈ C∞(M, p) e si ha:

(∂/∂xi)|p(xj) = δij

con δij la delta di Kronecker, i coefficienti ai di v sono determinati da:

v(xj) =m∑i=1

ai(∂/∂xi)|p(xj) = aj.

In particolare, se (V, ψ = (y1, . . . , ym)) e un’altra carta diM con p ∈ V , allora abbiamo anchei vettori tangenti (∂/∂yi)|p ∈ TpM . Per esprimere questi vettori tangenti come combinazionelineare delle (∂/∂xi)|p si noti:

(∂/∂yj)|p =m∑i=1

cij(∂/∂xi)|p con cij = (∂/∂yj)|p(xi),

Page 64: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 64

che generalizza la ben nota formula ∂/∂yj =∑

i(∂xi/∂yj)∂/∂xi.

4.3.3 Vettori tangenti e cammini. Un altro modo di definire un vettore tangente in TpMe il seguente. Sia ε > 0 e

γ : ]− ε, ε[−→M, γ(0) = p

un’applicazione liscia, detto cammino. Definiamo

γ∗ : C∞(M, p) −→ R, γ∗(f) :=

(df γ

)|τ=0

.

E’ facile mostrare che γ∗ ∈ TpM .Viceversa, data una carta (U, φ = (x1, . . . , xm)) di M con p ∈ U e un vettore tangente

v =∑ai(∂/∂xi)|p ∈ TpM , sia a = (a1, . . . , am) ∈ Rm. Definiamo un cammino

γ : ]− ε, ε[−→M, γ(τ) = φ−1(φ(p) + τa)

con ε tale che φ(p) + τa ∈ φ(U) per τ ∈] − ε, ε[. Si verifica che γ∗ = v, quindi ogni vettoretangente si ottiene tramite un cammino.

4.3.4 Lo spazio tangente ad uno spazio vettoriale. Un caso importante, anche se banale,e M = V , uno spazio vettoriale reale di dimensione finita. Per p ∈ V si ha un isomorfismo‘naturale’ tra V e TpV nel modo seguente:

V∼=−→ TpV, a 7−→ γ∗, con γ(τ) = p+ τa.

Se V = Rm, l’isomorfismo e dato da a = (a1, . . . , am) 7→∑ai(∂/∂ti)|p. Questo isomorfismo

verra usato in varie occasioni in futuro.

4.3.5 Il differenziale di un’applicazione liscia. Sia f : M → N un’applicazione liscia travarieta di dimensione m e n rispettivamente. Per p ∈ M definiamo un’applicazione lineare, ildifferenziale di f in p:

(df)p : TpM −→ Tf(p)N, v 7−→ [g 7−→ v(g f)]

dove v ∈ TpM e g ∈ C∞(N, f(p)) (e quindi g f ∈ C∞(M, p)).Se γ∗ ∈ TpM e definito da un cammino γ, allora (df)pγ∗ ∈ Tf(p)N e definito dal cammino

f γ perche per g ∈ C∞(N, f(p)):

((df)pγ∗)(g) = γ∗(g f) = (d(g (f γ))/dτ)|τ=0 = (f γ)∗(g).

Siano (U, φ = (x1, . . . , xm)) e (V, ψ = (y1, . . . , yn)) carte di M e N rispettivamente con p ∈ Ue f(p) ∈ V . Allora delle basi di TpM e Tf(p)N sono i (∂/∂xi)|p e (∂/∂yj)|f(p) rispettivamente.La matrice (vij) dell’applicazione lineare (df)p e data da:

(df)p((∂/∂xj)|p) =n∑i=1

vij(∂/∂yi)|f(p).

Page 65: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 65

Usando (∂/∂yi)|f(p)(yj) = δij si trova:

vij =((df)p((∂/∂xj)|p

)(yi) = (∂/∂xj)|p(yi f).

Se scriviamo F = (F1, . . . , Fn) = ψ f φ−1 allora Fi = yi f φ−1 e

vij = (∂/∂xj)|p(yi f) = (∂(yi f φ−1)∂tj)(φ(p)) = (∂Fi/∂tj)(φ(p)).

Ne concludiamo che il differenziale (df)p e determinato dalla matrice jacobiana Jφ(p)(F ).

4.3.6 Il differenziale di una funzione liscia. Sia f : M → R una funzione liscia. Perp ∈M , il suo differenziale e una mappa lineare

(df)p : TpM −→ Tf(p)R = R, quindi (df)p ∈ T ∗pM := Hom(TpM,R).

Qui sfruttiamo l’isomorfismo Tf(p)R = R di 4.3.4. Il duale T ∗pM := (TpM)∗ dello spazio tangenteTpM e detto spazio cotangente. Ogni f ∈ C∞(M, p) definisce allora un elemento (df)p ∈ T ∗pM .Il differenziale e dato dalla seguente identita:

(df)p : TpM −→ R, (df)p(v) = v(f), (f ∈ C∞(M, p), v ∈ TpM).

Per verificare l’identita, si ricordi che l’isomorfismo Tf(p)R ∼= R identifica λ(∂/∂t)|f(p) conλ ∈ R. Sia g ∈ C∞(R, f(p)) e applichiamo la derivazione (df)p(v) ∈ Tf(p)R a g, scrivendov =

∑ai(∂/∂xi)|p ∈ TpM :

((df)p(v))(g) =∑ai∂g(fφ−1)

∂ti(φ(p))

=∑ai∂g∂t

(f(p))∂(fφ−1)∂ti

(φ(p))

= v(f)( ∂∂t

)|f(p)(g),

che verifica che (df)p(v)) ∈ Tf(p)R corrisponde a v(f) ∈ R.Sia (U, φ = (x1, . . . , xm)) una carta di M con p ∈ U , allora i (∂/∂xi)|p sono una base di

TpM . Poiche(dx)i)p((∂/∂xj)|p) = (∂/∂xj)|p(xi) = δij,

i (dxi)p ∈ T ∗pM sono la base duale di T ∗pM . L’elemento (df)p ∈ T ∗pM e la seguente combinazionelineare dei (dxi)p:

(df)p =∑i

(∂/∂xi)|p(f)(dxi)p

come si verifica facilmente valutando entrambi i membri sui vettori tangenti (∂/∂xj)|p perj = 1, . . . , n.

4.3.7 Il fibrato tangente. Sia M una varieta differenziabile di dimensione m. L’unionedisgiunta degli spazi tangenti ad M e denotata con

TM =∐p∈M

TpM, sia π : TM −→M, v 7−→ p

Page 66: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 66

se v ∈ TpM . Sia (U, φ = (x1, . . . , xm)) una carta locale di M . Allora per ogni p ∈ U , i vettoritangenti (∂/∂xi)|p sono una base di TpM . Quindi otteniamo una biezione

Φ : TU := π−1(U)∼=−→ U × Rm ∼=−→ φ(U)× Rm (⊂ Rm × Rm = R2m)

data dav =

∑ai(∂/∂xi)|p 7−→ (p, (a1, . . . , am)) 7−→ (φ(p), (a1, . . . , am)).

Si noti che p = π(v).Si puo mostrare che esiste una topologia di Hausdorff su TM t.c. π e continua. In piu, TM

e una varieta differenziabile, di dimensione 2m, con carte (TU,Φ) ottenute da carte (U, φ) diM come sopra. In particolare, Φ : TU → φ(U)× Rm e un omeomorfismo.

Per esempio, se V e uno spazio vettoriale, allora

V × V∼=−→ TV, (p, a) 7−→ γ∗

con γ(τ) = p+ τa.

4.3.8 Esempio: il fibrato tangente a una sottovarieta. Sia f : M → N una sommersionesu K = f−1(y) per un certo y ∈ N . Quindi K e una sottovarieta di M di dimensione r = m−ndove m = dimM , n = dimN (vedi 4.2.7). Per ogni p ∈ K lo spazio tangente TpK e unasottospazio di TpM . Se (U, φ = (x1, . . . , xn)) e una carta di M con p ∈ K ∩ U e tale cheK ∩ U = x ∈ M : xr+1(x) = . . . = xm(x) = 0 allora TpK e lo sottospazio di TpM con base(∂/∂xi)|p per 1 ≤ i ≤ r.

Sia v ∈ TpK definito da un cammino γ : ] − ε, ε[→ K. Allora f(γ(τ)) = y, un camminocostante, per ogni τ perche f(K) = y. Quindi (df)p(v) = 0 ∈ TyN cioe TpK ⊂ ker((df)p).Poiche l’applicazione lineare (df)p e suriettiva, perche (df)p e dato dalla matrice jacobiana incarte locali, segue che dimTpK = dimK = n−m e uguale a dim ker((df)p), percio:

TpK = ker((df)p : TpM −→ Tf(p)N) (p ∈ K).

Quindi, con significato ovvio, TK = ker(df : TM −→ TN).

4.3.9 Esempio: il fibrato tangente di Sn. Si ricordi (vedi Esempio 4.2.8) che Sn = f−1(1)dove

f : Rn+1 −→ R, x = (x1, . . . , xn+1) 7−→ x21 + . . .+ x2

n+1

e una sommersione sulla n-sfera Sn. Quindi per x ∈ Sn e y ∈ TxRn+1 = Rn+1 abbiamo chey ∈ TxS

n se e solo se (df)x(y) = 2x1y1 + . . . + 2xn+1yn+1 = 0. Sia (, ) il prodotto scalareeuclideo standard su Rn+1, (x, y) = x1y1 + . . .+ xn+1yn+1. Se non confondiamo le coppie (x, y)con il prodotto scalare (x, y) abbiamo allora:

TSn+1 = (x, y) ∈ Rn+1 × Rn+1 = TRn+1 : (x, x) = 1, (x, y) = 0 .

Non e difficile verificare che l’applicazione

F : Rn+1 × Rn+1 −→ R2, (x, y) 7−→ ((x, x), (x, y))

Page 67: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 67

e una sommersione su F−1((1, 0)). Quindi TSn e una sottovarieta di R2n+2 e questa strutturadi varieta su TSn coincide con quella data dalle carte (TU,Φ) come in 4.3.7.

Nel caso n = 1, il fibrato tangente TS1 e diffeomorfo al prodotto S1 × R. Un talediffeomorfismo e:

f : S1 × R −→ TS1, ((x1, x2), t) 7−→ (x, y) = ((x1, x2), t(−x2, x1)).

Per dare qualche idea su come e fatto il fibrato TS2, definiamo il fibrato tangente unitario:

T1S2 = (x, y) ∈ TS2 : (x, x) = (y, y) = 1, (x, y) = 0 .

Si noti che ogni fibra π−1(x) di π : T1S2 → S2 e diffeomorfa a S1. E’ facile verificare che T1S

2

e una sottovarieta di R3 × R3 e quindi anche di TS2.La varieta T1S

2 e diffeomorfa a SO(3) = A ∈ O(3) : det(A) = 1. Si ricordi che unamatrice A = (a1|a2|a3), con colonne ai, sta in SO(3) esattamente se le colonne sono unabase ortonormale di R3, quindi ||ai||2 = (ai, ai) = 1 e (ai, aj) = 0 se i 6= j. Poi si ricordiche dati due vettori x, y ∈ R3 il loro prodotto vettoriale x × y e perpendicolare a entrambie ||x × y|| = ||x||||y||senφ dove φ ∈]0, π[ e l’angolo tra i vettori x, y (nel piano 〈x, y〉). In piu,det(x, y, x×y) ≥ 0 in quanto i vettori x, y, x×y sono ortientati. Da cio segue che l’applicazione

f : TS2 −→ SO(3), (x, y) 7−→ A = (x|y|x× y)

e ben definita ed e facile vedere che f e f−1 sono lisce.

4.3.10 Campi vettoriali. Sia M una varieta differenziabile e sia π : TM → M il fibratotangente. Un campo vettoriale X su un aperto V di M e un’applicazione liscia

X : V −→ TV := π−1(V ) t.c. π X = idV .

Si noti che π(X(p)) = p implica che X(p) ∈ π−1(p) = TpM . Quindi un campo vettoriale su Vda per ogni p ∈ V un vettore tangente X(p) in TpM . Se (U, φ = (x1, . . . , xm)) e una carta diM con U ⊂ V allora per ogni p ∈ U si ha

X(p) = a1(p)(∂/∂x1)|p + . . .+ am(p)(∂/∂xm)|p, (ai(p) ∈ R)

e X e liscia su U equivale a dire che gli ai : U → R sono funzioni lisce. L’insieme dei campivettoriali su V si indica con X (V ).

Dati i campi vettoriali X, Y ∈ X (V ) e le funzioni lisce f, g ∈ C∞(V ), definiamo un campovettoriale fX + gY su V come:

(fX + gY )(p) := f(p)X(p) + g(p)Y (p) (∈ TpM),

dove p ∈ V . Con questo operazione l’insieme X (V ) e un modulo sull’algebra C∞(V ), inparticolare, X (V ) e un gruppo abeliano.

Dati X ∈ X (V ) e f ∈ C∞(V ) otteniamo una funzione liscia X(f) su V nel modo seguente:

X(f)(p) := Xp(f), dove Xp := X(p) (∈ TpM)

Page 68: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 68

e dove p ∈ V . Per verificare che X(f) e liscia, si usa l’espressione locale per X data qui sopra:se F = f φ−1 e t = φ(p) ∈ Rm allora X(f)(p) =

∑ai(φ

−1(t))(∂F/∂ti)(t) che e liscia percheai φ−1 e F sono lisce su φ(U).

4.3.11 Parentesi di Lie. Dati i campi vettoriali X, Y ∈ X (V ) su un aperto V ⊂ M e unafunzione liscia f ∈ C∞(V ) la funzione Y (f) e liscia su V . Per p ∈ V consideriamo la mappa

f 7−→ Xp(Y (f)) (∈ R, f ∈ C∞(V )).

Questa mappa non e una derivazione in generale. Per esempio, se V = M = R, X = Y = ∂/∂te p = a ∈ R allora Xp(Y (f)) = f ′′(a), ma l’applicazione f 7→ f ′′(a) non soddisfa la regola diLeibnitz. Piu in generale, ogni campo vettoriale su R si scrive come g∂/∂t per g ∈ C∞(R). SeX = g∂/∂t, Y = h∂/∂t, si ha:

Xp(Y (f)) = Xp(hf′) = (ghf ′′ + gh′f ′)|t=a = g(a)h(a)f ′′(a) + g(a)h′(a)f ′(a)

e si noti che la parte ‘sbagliata’ e g(a)h(a)f ′′(a): questa espressione e pero simmetrica in g, hcioe in X, Y .

Definiamo le parentesi di Lie [X, Y ] di due campi vettoriali X, Y ∈ X (V ) come:

[X, Y ]p(f) := Xp(Y (f))− Yp(X(f)) (∈ R, X, Y ∈ X (V ), p ∈ V, f ∈ C∞(V )).

Nell’esempio si ottiene:

[X, Y ]p(f) = (g(a)h(a)f ′′(a) + . . .)− (. . .+ h(a)g′(a)f ′(a)) = (g(a)h′(a)− g′(a)h(a))f ′(a)

e quindi [X, Y ]p e una derivazione. Il campo vettoriale [X, Y ] e allora dato da

[X, Y ] = (gh′ − h′g)∂/∂t, (X = g∂/∂t, Y = h∂/∂t ∈ X (R)).

In generale, in coordinate locali si ha:

[X, Y ] =∑i,j

(Xj∂Yi/∂xj − Yj∂Xi/∂xj)∂/∂xi (X =∑

Xi∂/∂xi, Y =∑

Yi∂/∂xi)

Le parentesi di Lie godono delle proprieta seguenti:

[X, Y ] = −[Y,X], [X, [Y, Z]] + [Y, [Z,X]] + [Z, [X, Y ]] = 0

la seconda identita e detta identita di Jacobi (si noti la permutazione ciclica degli argomenti).Un altro modo di scrivere l’identita di Jacobi e:

adZ([X, Y ]) = [X, adZ(Y )] + [adZ(X), Y ]

dove adZ(V ) := [Z, V ]. In questa scrittura si vede che adZ soddisfa la regola di Leibnitz per ilprodotto dato dalle parentesi di Lie.

Page 69: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 69

4.4 Forme differenziali.

4.4.1 Il fibrato delle k-forme. Sia M una varieta differenziabile di dimensione m. Perp ∈ M abbiamo definito lo spazio cotangente T ∗pM = Hom(TpM,R) e il suo k-esimo prodottoesterno ∧kT ∗pM , uno spazio vettoriale di dimensione (mk ). Similmente alla definizione del fibratotangente si puo definire una varieta differenziabile, il fibrato delle k-forme,

∧k(M) :=∐p∈M

∧kT ∗pM, π : ∧k(M) −→M

dove π e un’applicazione liscia tale che π(∧kT ∗pM) = p. Definiamo inoltre ∧0(M) = M × R.Una k-forma differenziale su un aperto V di M e un’applicazione liscia

ω : V −→ ∧k(V ) := π−1(V ) (⊂ ∧k(M))

tale che π ω = idV , cioe, per ogni p ∈ V si ha che ω(p) ∈ π−1(p) = ∧kT ∗p M . Se (U, φ =(x1, . . . , xm) e una carta di M con U ⊂ V , i differenziali (dxi)p sono una base di T ∗pM , quindi

ω(p) =∑I,]I=k

aI(p)dxI (∈ ∧kT ∗pM),

e ω e liscia se e solo se le funzioni aI sono lisce. Una 0-forma e semplicemnete una funzioneliscia f : V → R.

L’insieme delle k-forme differenziali su V si denota con Ωk(V ) e si ha Ω0(V ) = C∞(V ). Perf, g ∈ C∞(V ) e ω, θ ∈ Ωk(V ) si definisce una k-forma con:

(fω + gθ)(p) = f(p)ω(p) + g(p)θ(p) (∈ ∧kT ∗pM).

Data una 1-forma ω ∈ Ω1(M) e un campo vettoriale X ∈ X (M) si definisce una funzioneliscia ω(X) ∈ C∞(M) tramite ω(X)(p) := ω(p)(X(p)). Piu in generale, una k-forma ω ∈Ωk(M) e k campi vettoriali X1, . . . , Xk ∈ X (M), definiscono una funzione liscia ω(X1, . . . , Xk),localmente tramite ω(X1, . . . , Xk) =

∑aI(dxI(X1, . . . Xk)):

ω(X1, . . . , Xk) ∈ C∞(M) con (dxi1 ∧ . . . ∧ dxik)(X1, . . . , Xk) = det(A), A = (dxia(Xb))

dove 1 ≤ a, b ≤ k (vedi 1.3.5).

4.4.2 La derivata esterna. Sia V un aperto in una varieta M . Per f ∈ C∞(V ) = Ω0(V ) e p ∈V abbiamo definito il suo differenziale (df)p ∈ T ∗pM . In questo modo otteniamo un’applicazione

d = d0 : Ω0(V ) −→ Ω1(V ), (d0f)(p) = (df)p (∈ T ∗pM).

Si puo mostrare che per ogni k ≥ 0 esiste un’ unica applicazione

dk : Ωk(V ) −→ Ωk+1(V )

tale che:

Page 70: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 70

1. d0 = d,

2. dk e R-lineare,

3. dk(ω ∧ θ) = (daω) ∧ θ + (−1)aω ∧ (dbθ) per ω ∈ Ωa(V ), θ ∈ Ωb(V ) e k = a+ b,

4. dk+1 dk = 0.

L’unicita di dk implica che per ω ∈ Ωk(V ) e U ⊂ V un aperto si ha: dk(ω)|U = dk(ω|U), doveω|U ∈ Ωk(U) e le derivate dk sono su Ωk(V ) e Ωk(U) rispettivamente. Questo permette dicalcolare la derivata esterna su carte locali.

Sia (U, φ = (x1, . . . , xm)) una carta di M con U ⊂ V , e sia

ω =∑I,]I=k

aIdxI (∈ Ωk(U)),

con aI ∈ C∞(U) = Ω0(U). Per calcolare dkω sfruttiamo prima il fatto che dk e R-lineare

dkω = dk(∑I,]I=k

aIdxI) =∑I,]I=k

dk(aIdxI).

Poi applichiamo (3) con a = 0, b = k:

dk(aIdxI) = (d0aI) ∧ dxI + aIdk(dxI).

Poi mostriamo che dk(dxI) = 0, usando ancora (3), con a = 1, b = k − 1:

dk(dxI) = dk(d0xi1 ∧ d0xi2 ∧ . . . ∧ d0xik)= (d1d0xi1) ∧ d0xi2 ∧ . . . ∧ d0xik − d0xi1 ∧ dk−1(d0xi2 ∧ . . . ∧ d0xik)

Per (4), d1d0 = 0. Usando (3) k − 1-volte si trova che dk−1(d0xi2 ∧ . . . ∧ d0xik) = 0. Quindi siottiene:

dkω = dk(∑I,]I=k

aIdxI) =∑I,]I=k

(daI) ∧ dxI .

4.4.3 Il pull-back di forme differenziali. Sia f : M → N un’applicazione liscia tra varietadifferenziabili. Allora f definisce un’applicazione lineare, il pull-back,

f ∗ : Ωk(N) −→ Ωk(M), (f ∗θ)(X1, . . . , Xk) := θ((df)X1, . . . , (df)Xk),

dove θ ∈ Ωk(N) e X1, . . . , Xk ∈ X (M).Si puo mostrare che la derivata esterna e compatibile con il pull-back:

f ∗(dθ) = d(f ∗θ).

Page 71: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 71

4.4.4 Forme differenziali su R3. Sia M = R3 e sia f ∈ Ω0(R3), cioe f : R3 → R sia unafunzione liscia. Allora

df =3∑i=1

∂f

∂xidxi. Si ricordi grad(f) =

(∂f

∂x1

,∂f

∂x2

,∂f

∂x3

).

Sia ω ∈ Ω1(R3), diciamo ω = gdx1 + hdx2 + kdx3 con g, h, k ∈ C∞(R3). Dunque si ha, congi = ∂g/∂xi ecc.:

d1ω = d1(gdx1 + hdx2 + kdx3)= (g1dx1 + g2dx2 + g3dx3) ∧ dx1 + . . .+ (k1dx1 + k2dx2 + k3dx3) ∧ dx3

= (h1 − g2)dx1 ∧ dx2 + (k1 − g3)dx1 ∧ dx3 + (k2 − h3)dx2 ∧ x3

dove abbiamo usato dxi∧dxj = −dxj ∧dxi. Usando l’operatore ∗ di Hodge (vedi 1.3.7), si puoidentificare questa 2-forma con una 1-forma:

∗d1ω = (k2−h3)dx1−(k1−g3)dx2+(h1−g2)dx3. Si ricordi rot

ghk

=

k2 − h3

−(k1 − g3)h1 − g2

.

In particolare, d1d0 = 0 corrisponde al fatto che rot(grad(f)) = 0 per ogni f ∈ C∞(R3).Sia θ ∈ Ω2(R3), diciamo θ = pdx1 ∧ dx2 + qdx1 ∧ dx3 + rdx2 ∧ dx3 con p, q, r ∈ C∞(R3). Si

ha:

d2θ = d2(pdx1 ∧ dx2 + qdx1 ∧ dx3 + rdx2 ∧ x3)= (p1dx1 + p2dx2 + p3dx3) ∧ dx1 ∧ dx2 + . . .+ (r1dx1 + r2dx2 + r3dx3) ∧ dx2 ∧ dx3

= (p3 − q2 + r1)dx1 ∧ dx2 ∧ dx3.

Si noti che usando l’operatore ∗ di Hodge si ha:

∗θ = rdx1 − qdx2 + pdx3 div(r,−q, p) = r1 − q2 + p3,

quindi d2d1 = 0 corrisponde al fatto che div(rot(f, g, h)) = 0 per ogni f, g, h ∈ C∞(R3).Usando le correspondenze qui sopra, otteniamo allora il diagramma

Ω0(R3)d0

−→ Ω1(R3)d1

−→ Ω2(R3)d2

−→ Ω3(R3)↓ ↓ ↓ ↓

C∞(R3)grad−→ C∞(R3)3 rot−→ C∞(R3)3 div−→ C∞(R3)

dove le applicazioni verticali sono come sopra.

4.4.5 Equazioni di Maxwell e forme differenziali. Nella teoria della relativita ristretta, ilcampo elettrico e magnetico vengono unificati, nel senso che risultano comportarsi come diversecomponenti di un unico campo tensoriale antisimmetrico, il tensore di Faraday

F = F µν =

0 Ex Ey Ez−Ex 0 Bz −By

−Ey −Bz 0 Bx

−Ez By −Bx 0

,

Page 72: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 72

sullo spazio-tempo R4. La metrica di Minkowski η = ηµνdxµ ⊗ dxν , dove x0 = ct,

(x1, x2, x3) = (x, y, z) e ηµν = diag1,−1,−1,−1 permette tramite abbassamento degliindici di interpretare F come una 2−forma su R4,

θ =1

2Fµνdx

µ ∧ dxν .

Allora, se i = 1, 2, 3 mentre 0 si riferisce alla coordinata temporate, si ha θ0i = Ei e, vista comeuna due forma su R3, 1

2θijdx

i ∧ dxj = ∗B9.D’altra parte il tensore di Faraday deve risolvere le equazioni di Maxwell che in forma covariantesono

∂Fµν∂xρ

+∂Fρµ∂xν

+∂Fνρ∂xµ

= 0 ,

∂F ρν

∂xρ=

cjν

dove jν e la tetra-corrente. Si noti che la prima equazione coincide con dθ = 0. Vogliamoscrivere anche la seconda nel linguaggio delle forme differenziali. A tale scopo consideriamo ilduale di Hodge in R4, dotato del tensore metrico η. Seguendo 1.3.7 abbiamo10

∗θ = ε(2) (∧2η)−1

(1

2

∑i 6=06=j

Fijdxi ∧ dxj +

∑i 6=0

F0idx0 ∧ dxi

)

= ε(2)

(1

2

∑i 6=06=j

Fij∂

∂xi∧ ∂

∂xj−∑i 6=0

F0i∂

∂x0∧ ∂

∂xi

)

=1

2

∑i 6=0,j 6=0,k 6=0

εijk(Fijdx

0 ∧ dxk − F0idxj ∧ dxk

),

dove εijk sono le componenti della 3−forma dx1∧dx2∧dx3 = 16εijkdx

i∧dxj∧dxk. Di conseguenza

d ∗ θ =1

2

∑i 6=06=j; k 6=06=l

(∂Fij∂xl

εkijdx0 ∧ dxl ∧ dxk

)+

1

2

∑i 6=06=j; k 6=06=l

(∂F0i

∂xjεikldx

j ∧ dxk ∧ dxl)

−1

2

∑i 6=06=k 6=06=l

(∂F0i

∂x0εikldx

0 ∧ dxk ∧ dxl),

ed infine, usando∑

i εijlεihk = δjhδlk − δjkδlh,

∗d ∗ θ =∑s 6=0

∂F0s

∂xsdx0 +

∑i 6=06=j

(∂Fij∂xi− ∂F0j

∂x0

)dxj .

9Qui stiamo trattando B come una uno forma su R3 dipendente da un parametro t e il duale di Hodge einteso in R3. Si noti che sono tensori rispetto alle trasformazioni di R3 ma non a quelle di R4.

10qui non adottiamo la convenzione di Einstein per evitare confusione

Page 73: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 73

Se introduciamo la 1−forma J := jµdxµ e ricordiamo che ∗∗ = −id, le equazioni di Maxwellassumono percio la semplice forma

dθ = 0 ,

d ∗ θ =4π

c∗ J .

In particolare dalla seconda segue che deve aversi per consistenza d∗J = 0 e dunque ∗d∗J = 0che e l’equazione di continuita per J espressa nel linguaggio delle forme differenziali (verificare):∂jµ

∂xµ= 0.

4.4.6 La 1-forma canonica sul fibrato cotangente. Sia M una varieta di dimensione m esia T ∗M il suo fibrato cotangente, che e una varieta di dimensione 2m. Mostriamo che si puodefinire, in modo intrinseco, un elemento di Ω1(T ∗M).

Sia θ ∈ T ∗pM = π−1(p) dove π : T ∗M → M . Il differenziale di π in θ e un’applicazionelineare dallo spazio tangente al fibrato cotangente di M in θ allo spazio tangente di M inπ(θ) = p:

(dπ)θ : Tθ(T∗M) −→ TpM.

Poiche θ ∈ T ∗pM , abbiamo una mappa lineare θ : TpM → R e quindi la composizione di (dπ)θe θ da una mappa lineare

ϑθ =: θ (dπ)θ : Tθ(T∗M) −→ R,

cioe ϑθ ∈ T ∗θ (T ∗M) e in questo modo otteniamo una 1-forma ϑ ∈ Ω1(T ∗M).Per calcolare ϑ in coordinate locali, prendiamo una carta (U, (φ = (x1, . . . , xm)) di M con

p ∈ U . Allora otteniamo una carta locale

Φ : T ∗U = π−1(U) −→ R2m,m∑i=1

yi(dxi)p 7−→ ((x1(p), . . . , xm(p), y1, . . . , ym)).

Tramite questa carta otteniamo la base (∂/∂xi)θ, (∂/∂yi)θ, con 1 ≤ i ≤ m, di Tθ(T∗M). In

coordinate locali, la mappa π e (x, y) 7→ x. Si ha allora:

(dπ)θ((∂/∂xi)θ) = (∂/∂xi)p, (dπ)θ((∂/∂yi)θ) = 0.

Percio, con θ =∑yi(dxi)p ∈ T ∗pM si ha:

ϑθ(m∑i=1

qi(∂/∂xi)θ + ri(∂/∂yi)θ) = θ(m∑i=1

qi(∂/∂xi)p) =m∑i=1

yiqi.

Usando le coordinate locali (x1, . . . , xm, y1, . . . , ym) su T ∗M abbiamo infine:

ϑ =∑

yidxi, e quindi dϑ =m∑i=1

dyi ∧ dxi.

La 2-forma dϑ e alla base della teoria Hamiltoniana della meccanica classica.

Page 74: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 74

4.5 Geometria differenziale e meccanica

Come esempio di applicazione della geometria differenziale alla fisica rivediamo qui alcuniaspetti della meccanica classica Hamiltoniana dal punto di vista geometico.

4.5.1 Equazione di Newton e geometria. Consideriamo il moto di una particella dimassa m soggetta ad un determinato campo di forze che per ora chiameremo semplicemente~F (x) ed al quale daremo un significato piu preciso tra poco. Supponiamo che la particella simuova su una varieta M che ammetteremo essere di classe C∞. Per esempio potrebbe muoversisu una superficie sferica perfettamente liscia o su un iperboloide di rotazione e cosı via. Sia n ladimensione di M . La traiettoria della particella sara una curva γ nella varieta e la sua velocitaall’istante t sara percio un vettore nello spazio tangente Tγ(t)M . Vediamo dunque che il fibratotangente si presenta in modo naturale come l’oggetto geometrico piu adeguato per descrivereil moto della particella, rappresentando lo spazio delle posizioni e delle velocita assumibili daessa. Infatti la descrizione matematica del fibrato tangente risulta particolarmente adatta alladescrizione fisica non solo da un punto di vista teorico, ma in un certo senso anche dal puntodi vista pratico. Come e stato mostrato, scelto un atlante per M , il fibrato tangente TM puoessere descritto localmente come il prodotto φ(U) × Rn, in cui U e un aperto di una cartalocale (U, φ). Cio e essenzialmente quello che fa un fisico quando, per descrivere il fenomenoin considerazione, introduce in una certa regione (corrispondente all’intorno U) un riferimento(che individua i punti di U in termini di una certa regione di Rn) rispetto al quale misurain ogni istante la posizione e la velocita della particella. La velocita risultera allora essere unvettore v ∈ Rn, cosicche l’isomorfismo locale π−1(U) ' U × Rn e realizzato in modo concretodal fisico che effettua l’esperimento, essendo essenzialmente v = d

dtφ(γ(t)).

In sostanza e quindi conveniente dal punto di vista geometrico vedere in ogni istante la velocitadella particella come un punto in TM . Nella notazione del paragrafo 4.3.3 scriveremo alloraγ(t) = (γ(t), γ∗|γ(t)). Piu precisamente, vediamo la curva

γ : R −→M , t 7−→ γ(t) ,

come una mappa differenziabile tra varieta differenziabili11. Allora il differenziale di γ definisceuna mappa

dγ : TR −→ TM ,

come mostrato in 4.3.5. Consideriamo il campo vettoriale su R

Xt : R −→ TR ' R2 , πR Xt = idR , t 7−→ Xt(t) =

(t,∂

∂t

).

Allora γ = dγ Xt, cioe e definita dai diagrammi commutativi

TR dγ−→ TMXt ↑ γ

R

TMγ ↓ πM

R γ−→ M

11dove la struttura differenziale di R e come al solito definita dall’unica carta locale (R, idR); eventualmentein luogo di R la curva puo essere definita su un intervallo (a, b) ma il concetto non cambierebbe.

Page 75: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 75

Una volta chiarito il concetto di velocita dal punto di vista geometrico, e evidente come debbaessere trattata l’accelerazione γ = (γ)·. Poiche γ e una curva in TM , similmente γ sara unacurva in T (TM) costruita rispetto a γ esattamente nello stesso modo in cui abbiamo costruitoγ rispetto a γ. Mentre lasciamo come esercizio i dettagli della costruzione di γ, ci basti oraosservare che se γ(t) = (γ(t), γ∗|γ(t)) allora

γ = ((γ(t), γ∗|γ(t)); (γ(t), γ∗|γ(t))∗) = ((γ(t), γ∗|γ(t)); (γ∗|γ(t); γ∗∗|γ∗|γ(t))) ,

cosicche il secondo ed il terzo elemento coincidono.Tale osservazione diventa fondamentale nel momento in cui dobbiamo scrivere la seconda leggedi Newton per la meccanica: mγ = F . Perche tale equazione sia ben definita occorre anzituttoche F abbia valori in T (TM) e possiamo dunque pensare al campo di forze F come un campovettoriale su TM

F : TM −→ T (TM) , πTM F = idTM ; (x,~v) 7−→ F (x,~v) .

Una tale definizione non e completa poiche in generale non sarebbe compatibile con l’equazionedi Newton. Infatti il generico punto di T (TM) lo possiamo scrivere in coordinate locali nellaforma ((x, v); (w, z)) ∈ R2n×R2n, mentre l’accelerazione, come abbiamo notato pocanzi, richiedeche la seconda e la terza componente debbano coincidere. Questa condizione puo essere scrittain maniera piu elegante nel linguaggio geometrico.Osserviamo anzitutto che c’e una mappa naturale

πTM : T (TM) −→ TM , ((x, v); (w, z)) 7−→ (x, v) .

D’altra parte si consideri la mappa analoga πM : TM →M . Il suo differenziale e la mappa

dπM : T (TM) −→ TM , ((x, v); (w, z)) 7−→ (x,w) .

La condizione soddisfatta dall’accelerazione puo dunque essere scritta nella forma πTM γ =dπM γ. La stessa condizione deve percio essere soddisfatta dal campo di forze: chiameremocampo di forze una mappa

F : TM −→ T (TM) , πTM F = idTM ; πTMF = dπMF .

Con tale definizione si puo infine scrivere l’equazione di Newton sulla varieta M

mγ = F γ .

Si noti che scritta in questa forma essa e indipendente dalla scelta delle coordinate o di unacarta locale.

4.5.2 Richiami di meccanica Hamiltoniana. Una descrizione ancora piu geometrica siottiene nel formalismo Hamiltoniano.Si consideri una particella soggetta a forze conservative, descritte da un potenziale V (qi), dove

Page 76: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 76

qi sono le coordinate generalizzate che individuano la posizione della particella. In termini dellafunzione lagrangiana12

L : TM −→ R , L(qj, qj) = T (qj, qj)− V (qj) ,

dove T (qj, qj) e l’energia cinetica, l’equazione di Newton per la dinamica assume la forma

d

dt

∂L∂qj

=∂L∂qj

, qj =dqj

dt.

Si noti che in questa forma le equazioni del moto sono covarianti, nel senso che trasformanoesattamente come la base locale dello spazio tangente TMq come in 4.3.2. Si lascia come eserciziola verifica di questo fatto. Poiche nel caso in cui la lagrangiana non dipenda esplicitamentedalla coordinata qJ0 per qualche fissato j0 le equazioni del moto implicano che pj0 := ∂L

∂qj0sia

una costante del moto, appare opportuno considerare in luogo di (qi, qj) le variabili (qi, pj)dove pj := ∂L

∂qj, detti momenti coniugati alle variabili qi, purche il sistema di equazioni ottenuto

sia equivalente. Qui abbiamo utilizzato appositamente il termine variabili anziche coordinate,poiche come osservato pocanzi pi si comportano (almeno fintanto che si impongono le equazionidel moto) come le componenti di un covettore e dunque descrivono localmente il fibrato cotan-gente piuttosto che il fibrato tangente. Comunque ci viene in aiuto il fatto che localmente ilfibrato tangente e quello cotangente sono tra di loro diffeomorfi (ed in particolare sono diffeo-morfi a U × Rn, dove U e un aperto di qualche carta locale) cosicche risulta evidente che ilnuovo sistema sara equivalente al precedente se la mappa

qj 7−→ pj =∂L∂qj

e invertibile, cioe ci permette di ricavare qi come funzioni di pi e qk. Il teorema della funzioneimplicita ci dice che questo e garantito localmente dalla condizione det ∂2L

∂qi∂qj6= 0.

Ammesso che tale condizione sia soddisfatta si introduce allora la funzione

H : T ∗M −→ R , H(qi, pj) = (pkqk − L)|qj=qj(qi,pk) ,

rispetto alla quale le equazioni del moto diventano (esercizio)

dqj

dt=∂H

∂pjdpjdt

= −∂H∂qj

.

Indichiamo con xI , i = 1, . . . , 2n le coordinate del generico punto di T ∗M , dove xi = qi,xn+i = pi, i = 1, . . . , n. Se introduciamo la matrice 2n× 2n antisimmetrica

E =

(O I−I O

),

12qui (qi, qj) sono coordinate locali in TM

Page 77: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 77

dove O e I sono le matrici nulla ed identita n×n, possiamo scrivere le equazioni del moto nellaforma

dxI

dt= EIJ ∂H

∂xJ.

Dal punto di vista geometrico abbiamo che dxI

dte un vettore tangente a T ∗M nel punto di co-

ordinate xI, mentre ∂H∂xJ

e un covettore dello spazio cotangente nello stesso punto. Possiamodunque vedere la matrice E come una mappa E : T ∗x (T ∗M) → Tx(T

∗M) ed e cioe un tensorecontrovariante di secondo grado. Essa e chiaramente una mappa non degenere e la sua inversaE−1, usualmente indicata con ω, e dunque un tensore covariante antisimmetrico, che individuapertanto una due-forma ω = 1

2ωIJdxI ∧ dxJ = dqi ∧ dpi. Confrontando con la sezione 4.4.6,

vediamo allora che ω = −dϑ, dove ϑ e la uno-forma canonica su T ∗M .Possiamo quindi concludere che la meccanica Hamiltoniana dal punto di vista geometrico edescritta in modo naturale sul fibrato cotangente ed e essenzialmente specificata da due ingre-dienti fondamentali: una funzione Hamiltoniana H : T ∗M → R e la forma canonica ϑ su T ∗M .Il differenziale della forma canonica definisce una due forma, talvolta chiamata la seconda formacanonica, che ha la proprieta di essere non degenere. Il differenziale di H definisce invece uncampo covettoriale su T ∗M che viene trasformato in un campo vettoriale dall’inversa della sec-onda forma canonica, ω−1 = −E. Diciamo XH := E(dH) (campo hamiltoniano). Le equazionidi Hamilton sono infine le equazioni che determinano le curve x(t) su T ∗M con la proprieta diessere in ogni punto tangenti al campo vettoriale XH . Una tale equazione si chiama equazionedi flusso per il campo XH .13

Associate al moto delle particelle possono esserci delle osservabili fisiche, che saranno dellefunzioni reali delle coordinate q e p delle particelle, come ad esempio potrebbe essere la loroenergia. Tali osservabili fisiche F (q, p) varieranno nel tempo seguendo l’evoluzione (q(t), p(t))determinata dalle equazioni di Hamilton. Derivando rispetto al tempo si ottiene

dF

dt= F , H ,

dove

F , H =∑i

∂F

∂qi∂H

∂pi− ∂F

∂pi

∂H

∂qi

sono le parentesi di Poisson. Come si vede immediatamente esse possono essere scritte nellaforma F , H = ω(XF , XH), che mette in evidenza il ruolo della seconda forma canonicanell’evoluzione temporale.E’ possibile a questo punto riformulare quanto esposto in questo paragrafo nel linguaggiorigoroso della geometria differenziale.

4.5.3 Formulazione geometrica della meccanica Hamiltoniana. Sia M una varietadifferenziabile reale n−dimensionale di classe C∞ sia T ∗M il corrispondente fibrato cotangente.Quest ultimo e naturalmente dotato di una 1−forma canonica ϑ, il cui differenziale da origine

13Si noti che le equazioni di Newton nella precedente sezione sono anch’esse delle equazioni di flusso per ilcampo vettoriale F su TM , essendo appunto γ una curva su TM .

Page 78: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 78

ad una 2−forma nondegenere ω = −dϑ. Si dice allora che tale 2−forma provvede T ∗M di unastruttura simplettica naturale. In particolare essa definisce una mappa

E : T ∗(T ∗M) −→ T (T ∗M) , ν 7−→ E(ν) ∀ ν ∈ Ω1(T ∗M)

secondo la regola

ω(E(ν), X) := ν(X) , ∀ ν ∈ Ω1(T ∗M) , X ∈ X (T ∗M) .

In pratica, in un fissato punto e sistema di coordinate, E e rappresentata dall’inversa traspostadella matrice ωIJ delle componenti della 2− forma ω.Sia ora H ∈ C∞(T ∗M,R). Una tale funzione viene detta funzione hamiltoniana. Si chiamainvece campo hamiltoniano associato ad H il campo vettoriale XH := E(dH). E’ molto in-eteressante il problema inverso di stabilire se un campo vettoriale X su T ∗M sia un campohamiltoniano, cioe se esiste una funzione hamiltoniana al quale il campo e associato. Si chiamacontrazione del campo X con la 2−forma ω la 1−forma iXω definita da14

iX(ω)(Y ) := ω(X, Y ) , ∀ X ∈ X (T ∗M) .

Il problema posto equivale allora a chiedersi se esiste una funzione F di tipo hamiltoniano taleche iXω = dF . Se F esiste si dice che iXω e esatta. Evidentemente una condizione necessariae che valga d(iXω) = 0. Se e soddisfatta si dice che iXω e chiusa: una forma esatta e sempreanche chiusa. Tuttavia tale condizione non e in generale sufficiente poiche non e detto che unaforma chiusa sia anche esatta. Per fare un esempio di forma chiusa ma non esatta si consideri launo forma ν = dφ sul cerchio S1, essendo φ la funzione coordinata angolare. E’ facile verificareche ν e ben definita su tutto il cerchio, mentre la funzione φ non lo e ovviamente. Dunque νe chiusa ma non esatta. Tuttavia notiamo che se restringiamo il problema, anziche su tuttoil cerchio, ad un sottoinsieme aperto proprio di S1, allora in tale aperto ν|U e esatta: mentrenon esiste una funzione φ ∈ C∞(S1,R) tale che ν = dφ, si ha che φ e ben definita su U e si haν|U = dφ|U . Si dice allora che ν e localmente esatta. Si puo dimostrare che questo fatto e veroin generale, cioe ogni forma chiusa e localmente esatta. In altre parole se iXω e chiusa alloraper ogni punto x ∈ T ∗M esiste un intorno aperto U ∈ T ∗M che lo contiene ed una funzioneF ∈ C∞(U,R) tale che iXω|U = dF . In tal caso si dice che il campo e localmente hamiltoniano.Si chiama sistema hamiltoniano la tripla M,ω,H. Ad esso si associa il problema delladeterminazione del flusso hamiltoniano. Dato un campo vettoriale Y ∈ X (N ) su una varietadifferenziabile N ed un punto p ∈ N , si vuole determinare una curva γ : (−a, a) ∈ N , conγ(0) = p e che in ogni punto sia tangente al campo vettoriale dato. Seguendo la notazione delparagrafo 4.5.1 si deve risolvere dunque il problema di Cauchy

γ(t) = Y γ(t) ,γ(0) = p .

L’equazione differenziale si chiama equazione di flusso del campo Y . Si chiamano equazionidi Hamilton associate al dato sistema Hamiltoniano le equazioni di flusso per il campo XH =

14dovrebbe da qui essere chiaro come si possa definire la contrazione iXω ∈ Ωn−1(M) per ogni ω ∈ Ωn(M) eX ∈ X (M).

Page 79: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 79

E(dH). Il problema di Cauchy e localmente ben definito, ma si puo in effetti porre il problemain una forma piu debole ma piu interessante che presentiamo nel seguente paragrafo.

4.5.4 Flussi ed evoluzione temporale. Si consideri un campo vettoriale V ∈ X (N ) e larelativa equazione di flusso. In particolare si prenda in considerazione il problema di Cauchy

γ = V γ ,γ(0) = p0 ∈ N .

Introducendo una carta locale intorno a p0 non e difficile dimostrare che localmente la soluzioneesiste sempre ed e unica. Essa e detta curva integrale di V passante per p0. Ancora piuinteressante e il fatto che e possibile dimostrare che15 vi e dipendenza continua e differenziabiledal dato iniziale p0. Piu precisamente esiste un intorno U ∈ N contenente p0 ed ε > 0 tale che,detta γ(t; p) la soluzione del problema di Cauchy associato all’equazione di flusso per V conpunto iniziale γ(0) = p ∈ U , allora l’applicazione

ΦVt : U −→ N , q 7−→ ΦV

t (q) = γ(t; q) ,

e un diffeomorfismo tra U e ΦVt (U) per ogni fissato t ∈ (−ε, ε). L’applicazione ΦV

t , che pert fissato determina un diffeomorfismo locale mentre per p ∈ U fissato determina una curvaintegrale per V , viene detta flusso locale o semplicemente flusso di V .Se il campo vettoriale e hamiltoniano V = XH , allora si puo immaginare che ogni punto p ∈ Usia una particella la cui evoluzione temporale e descritta da un sistema hamiltoniano. All’istantet = 0 tutte le particelle riempiranno la regione U dello spazio delle fasi (in tal caso N = T ∗Mper qualche M). Al variare del tempo esse occuperanno invece la posizione ΦXH

t (p). Vediamodunque che in tal caso il flusso di XH individua quindi l’evoluzione temporale del sistema. Essoe detto in tal caso flusso hamiltoniano.Un altro esempio di origine fisica e quello di immaginare U come una regione attraversata daun fluido in moto stazionario, di cui V rappresenti il campo di velocita. In tal caso i punti di Upossono essere visti come i punti del fluido all’istante t = 0 che invece occuperanno la posizioneΦVt (p) all’istante t.

Ritornando al caso di un flusso Hamiltoniano, si noti che esso permette di definire l’evoluzionetemporale di una osservabile fisica. Se O ∈ C∞(M,R) allora Ot = O ΦXH

t rappresentera lastessa osservabile all’istante t. Si osservi che in particolare il flusso ha le proprieta ΦV

0 = id eΦVt1 ΦV

t2= ΦV

t1+t2.

D’altra parte piu in generale una osservabile fisica potrebbe essere un campo vettoriale otensoriale.

4.5.5 Pull back. Siano date due varieta differenziabili M ed N ed un’applicazione f :M → N liscia. Si consideri un campo tensoriale covariante di grado q, V ∈ Γ(N, T ∗N⊗q), dicui in particolare fanno parte le forme differenziali. Poiche la fibra di T ∗N⊗q altro non e che ilduale della fibra di TN⊗q, e naturale in tal caso introdurre il concetto di pull back di V tramite

15si assume che sia la varieta che il campo vettoriale sono di classe C∞

Page 80: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 80

l’applicazione liscia f : M → N . Esso trasporta il campo V all’indietro, da N a M , nel campotensoriale f ∗(V) ∈ Γ(N, T ∗M⊗q) definito dalla commutativita del seguente diagramma

T ∗M⊗q T ∗f←− T ∗N⊗q

f ∗(V) ↑ V ↑M

f−→ N

essendo T ∗f la mappa cotangente di f , cioe la trasposta della mappa tangente:

〈T ∗f(V)(x), T (x)〉 = 〈V(f(x)), T f(T )(f(x))〉, ∀ x ∈M, T ∈ Γ(M,TM⊗q) ,

mentre 〈 , 〉 e la valutazione dei funzionali sui vettori. Dunque f ∗(V) = T ∗f Vf . Si noti che intale formula non compare l’inversa di f cosicche il pull back e ben definito anche qualora f nonsia un diffeomorfismo, ma semplicemente una applicazione liscia. In particolare, in coordinatelocali il pull back e descritto dalla trasposta della matrice jacobiana composta con f (esercizio).

4.5.6 Push forward. Siano date due varieta differenziabili M ed N ed un’applicazionef : M → N liscia. Sia poi V ∈ X (M) un campo vettoriale su M . Si vuole indurre uncampo vettoriale su N tramite f , che verra denotato con f∗(V ). A tale scopo consideriamo ildiagramma commutativo

TMdf−→ TN

πM ↓ πN ↓M

f−→ N

dal quale si vede che un campo su N puo essere ottenuto ponendo f∗(V ) = df V f−1, cioe pery ∈ N si ha f∗(V )y = (df)xV (x) dove x = f−1(y). In particolare dunque f∗(V ) e ben definitose f e un diffeomorfismo. La mappa f∗ viene detta push forward e vale la commutativita deldiagramma

TMdf−→ TN

V ↑ f∗(V ) ↑M

f−1

←− N

E’ semplice determinare l’espressione per il push forward di V in coordinate locali e lo si lasciacome esercizio (si veda la sezione 4.3.5). In generale, si considera il diagramma precedente con

TM⊗p Tf−→ TN⊗p

T ↑ f∗(T ) ↑M

f−1

←− N

dove: TM⊗p e il prodotto tensore di TM per se stesso p volte, cioe un fibrato vettorialesu M che ha per fibra in x ∈ M lo spazio vettoriale TxM

⊗p; T e una sezione del fibratotensoriale16, cioe una applicazione liscia T : M → T⊗pM tale che π T = idM , essendo π la

16si scrive T ∈ Γ(M,TM⊗p), in particolare Γ(M,TM) = X (M)

Page 81: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 81

proiezione su M ; Tf e l’estensione della mappa df , detta anche mappa tangente, definita daTf(TM⊗p) = (df(TM))⊗p.Poiche f e un diffeomorfismo, si puo definire anche il push forward di un campo tensorialecovariante su M tramite f , come il pullback tramite f−1. Questo permette di estendere ilconcetto di push forward al caso di campi tensoriali misti. Le espressioni locali in tal casogeneralizzano i concetti di covarianza e controvarianza introdotti nella sezione 1.217.Si noti infine che per un campo scalare S, cioe un campo tensoriale di tipo (0, 0), si ha f∗S =S f−1.

4.5.7 Derivata di Lie ed evoluzione temporale. Per quanto visto nel paragrafo 4.5.6 ein 4.5.4, si puo scrivere l’evoluzione temporale di una osservabile scalare S ∈ C∞(T ∗M,R) comeil suo push forward tramite φXH−t = (φXHt )−1, cioe St =

(φXH−t

)∗ (S). Questa forma puo essere

immediatamente generalizzata al caso di osservabili tensoriali O ≡ Opq ∈ Γ(M,TM⊗p⊗T ∗M⊗q)

per le quali scriveremo Ot =(φXH−t

)∗ (O).

Di questa espressione e possibile determinare l’equivalente infinitesimale, che si ottiene derivan-do rispetto al parametro t e ponendo t = 0. Il risultato ottenuto si chiama derivata di Lie delcampo tensoriale O rispetto al campo vettoriale XH :

LXHO = limt→0

(φXH−t

)∗ (O)−O0

t.

E’ chiaro che in generale si puo sostituire a XH un campo vettoriale V qualunque. In tal casola derivata di Lie di O rispetto a V si indica con LVO.Nel caso di un campo scalare S la derivata di Lie coincide con la derivata direzionale e si haLV S = 〈dS, V 〉. Se invece W e un campo vettoriale allora si trova LVW = [V,W ], coincidecioe con le parentesi di Lie introdotte in 4.3.11:

LV S := 〈dS, V 〉 := (dS)(V ) = V (S), LVW := [V,W ].

Infine per una qualunque k−forma differenziale ω si ha

LV ω = (iV d(k) + d(k−1) iV )ω, (ω ∈ Ωk(M)).

Si lascia come esercizio la dimostrazione di queste ultime due asserzioni.Consideriamo piu in dettaglio il caso di una osservabile scalare S. Allora

dS

dt= LXHS = 〈dS,XH〉 = ω(XS, XH) ,

in accordo con quanto osservato nella sezione introduttiva 4.5.2.

4.5.8 Derivata di Lie e derivata esterna. La derivata di Lie e permette di determinareuna formula comoda per il calcolo della derivata esterna di una forma differenziale. Sia ω una1−forma su M e V,W ∈ X (M) due campi vettoriali. Allora vale la seguente formula di Cartan

(dω)(V,W ) = LV (ω(W ))− LW (ω(V ))− ω([V,W ]) .

17in tal caso la matrice M di cambiamento di base va identificata con l’nversa trasposta della matrice jacobianacalcolata nel punto considerato

Page 82: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

4 GEOMETRIA DIFFERENZIALE 82

La dimostrazione si ottiene direttamente in carte locale, valutando entrambi i membri e os-servando che coincidono. Si noti che se la formula vale per ω = ω1, ω2 allora vale anche perω = ω1 + ω2, quindi basta verificarla nel caso ω = adxk con a ∈ C∞(M). Lasciamo comeesercizio la determinazione della generalizzazione alle k−forme.

Rimandiamo ad altri testi per ulteriori applicazioni della geometria alla meccanica Hamiltoni-ana. Volendo invece considerare applicazioni ad altri campi della fisica e conveniente dapprimasviluppare un po’ di concetti riguardanti la teoria dei gruppi di Lie e delle loro rappresentazioni.

Page 83: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 83

5 Gruppi e algebre di Lie

Testi consigliati: [FH], [DNF1], [DNF2], [Ha], [Wa].

5.1 Gruppi di Lie

5.1.1 Gruppi di Lie. Una varieta G e detta gruppo di Lie se esistono due applicazioni lisce

µ : G×G −→ G, ν : G −→ G,

e un punto e ∈ G tali che G sia un gruppo con elemento neutro e, prodotto g1g2 := µ(g1, g2), einversa g−1 := ν(g).

Un’applicazione f : H → G tra gruppi di Lie e un omomorfismo di gruppi di Lie se f eliscia e se f e un omomorfismo di gruppi. Un sottogruppo H ⊂ G di un gruppo di Lie e dettosottogruppo di Lie se e una sottovarieta di G, in quel caso H e anche un gruppo di Lie.

5.1.2 Sottogruppi di Lie immersi. Un punto delicato e che l’immagine f(H) di un omo-morfismo di gruppo di Lie f : H → G non e sempre un sottogruppo di Lie; ovviamente f(H)e un sottogruppo di G pero f(H) non e necessariamente una sottovarieta di G. Un esempio e(vedi anche 5.1.3) il caso H = R, G = (R/Z)2 (il toro), e l’omomorfismo

f : R −→ (R/Z)2, t 7−→ (t, at), (a ∈ R, a 6∈ Q).

Si noti che f e iniettiva (si ha (t, at) = (0, 0) se e solo se (t, at) ∈ Z2; se t 6= 0 e t, at ∈ Zallora si ha a = (at)/t ∈ Q in contraddizione con la scelta a 6∈ Q). Per ogni n ∈ Z troviamoun punto pn := (n, an) = (0, an) ∈ G e i pi sono distinti nello spazio topologico compatto Ge quindi hanno un punto di accumulazione p. Allora e impossibile trovare una carta locale(U, φ = (x1, x2)), con p ∈ U , di G tale che f(H) ∩ U = q ∈ U : x2(q) = 0, che e chiuso in U .

Un sottogruppo di Lie immerso e l’immagine di un omomorfismo di gruppi di Lie iniettivo.In particolare, f(H) qui sopra e un sottogruppo di Lie immerso di G.

5.1.3 Esempi. Il gruppo additivo (R,+) e un gruppo di Lie perche le applicazioni µ(x, y) = x+y e ν(x) = −x sono evidentemente lisce. Similmente il gruppo moltiplicativo R∗ := (R−0, ·)e un gruppo di Lie. L’applicazione exp : R→ R∗, exp(x) := ex e un omomorfismo di gruppi diLie.

Il gruppo di Lie R/Z puo essere definito come la varieta differenziabile S1 (⊂ R2), lacirconferenza, con legge del gruppo indotta dall’addizione degli angoli

µ : S1 × S1 −→ S1, µ((cosφ, senφ), (cosψ, senψ)) = (cos(φ+ ψ), sen (φ+ ψ))

e le formule ben note che esprimono cos(φ+ψ), sen (φ+ψ) in termini di cosφ, . . . , senψ mostranoche µ e liscia. Ovviamente anche l’inversa ν(cosφ, senφ) = (cosφ,−senφ) e liscia. Per essereprecisi, bisogna identificare t ∈ R/Z con il punto (cos(2πt), sen (2πt)) di S1.

Page 84: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 84

Il gruppo GL(n,R) e un gruppo di Lie. Ovviamente GL(n,R) e un gruppo ed e un apertodello spazio vettoriale Mn(R) di dimensione n2, quindi GL(n,R) e una varieta. I coefficientidi un prodotto AB di due matrici A e B sono polinomi nei coefficienti di A e B ((AB)ij =∑

k aikbkj), quindi µ e liscia. L’inversa ν e anch’essa liscia perche A−1 = (detA)−1A] dove A]

e la ‘matrice dei cofattori’ di A, cioe (A])ij e il determinante, moltiplicato per (−1)i+j, dellamatrice (n − 1) × (n − 1) ottenuta da A eliminando la j-esima riga e la i-esima colonna. Lafunzione det e data da un polinomio nei coefficienti di una matrice, e quindi e liscia. Poichedet(A) e liscia e non zero su GL(n,R), anche A 7→ ν(A) = (detA)−1A] e liscia su GL(n,R).

Ogni sottovarieta di GL(n,R) che e un sottogruppo di GL(n,R) e allora un gruppo di Lie.Esempi sono SL(n,R) (vedi 4.2.9) e SO(n,R) (vedi 4.2.10).

5.1.4 Rappresentazioni dei gruppi di Lie. Una rappresentazione (reale) di un gruppo diLie su uno spazio vettoriale V (reale) di dimensione n e un omomorfismo di gruppi di Lie

ρ : G −→ GL(V ) ∼= GL(n,R).

Esempi sono l’ inclusione SL(n,R) → GL(n,R), SO(n,R) → GL(n,R), la rappresentazionecontrogradiente GL(V ) −→ GL(V ∗) (vedi 1.1.12) e gli omomorfismi ρkl : GL(V )→ GL(T kl (V ))(vedi 3.1).

5.1.5 La rappresentazione Aggiunta. Sia G un gruppo di Lie e sia g := TeG, lo spaziotangente di G nell’identita e ∈ G. Per g ∈ G definiamo un automorfismo ig di G perconiugazione:

ig : G −→ G, h 7−→ ghg−1 (g, h ∈ G).

Poiche ig e un’applicazione liscia tale che ig(e) = e, si ha un’applicazione lineare, il suodifferenziale, che si chiama Ad(g)

Ad(g) := (dig)e : g = TeG −→ g.

Poiche ig ig−1 = idG si ha Ad(g)Ad(g−1) = idg, quindi Ad(g) ∈ GL(g).L’applicazione, detta applicazione ‘Aggiunta’,

Ad : G −→ GL(g), g 7−→ Ad(g)

e una rappresentazione di G perche (g1g2)h(g1g2)−1 = g1(g2hg−12 )g−1

1 implica:

igg′ = ig ig′ percio Ad(gg′) := (digg′)e = (dig)e (dig′)e = Ad(g) Ad(g′).

5.1.6 La rappresentazione Aggiunta per GL(n). Il gruppo di Lie GL(n,R) e un apertodella varieta Mn(R) ∼= Rn2

e quindi TIGL(n,R) ∼= TIMn(R) = Mn(R) (vedi 4.3.4 per l’ultimaidentificazione). Per calcolare Ad(g)(X), per g ∈ GL(n,R) e X ∈ TIGL(n,R) = Mn(R),consideriamo un cammino che rappresenta X:

γ : ]− ε, ε[−→ G ⊂Mn(R), tale che γ(0) = I, γ′(0) = X.

Page 85: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 85

Allora, usando una delle definizione di 4.3.5, Ad(g)(X) e definito dal cammino τ 7→ ig(γ(τ)) equesto cammino corrisponde a

Ad(g)(X) =

(d

dτig(γ(τ))

)|τ=0

=

(d(gγ(τ)g−1)

)|τ=0

= gXg−1

come si verifica differenziando ogni coefficiente della matrice gγ(τ)g−1 rispetto τ e ponendoτ = 0.

5.1.7 La rappresentazione Aggiunta per SL(n). Il gruppo di Lie SL(n,R) = det−1(1)e una sottavarieta di GL(n,R) e il suo spazio tangente in g ∈ SL(n,R) e lo spazio vettoriale(vedi 4.3.8)

TgSL(n,R) := ker((d det)g : TgGL(n,R) ∼= Mn(R) −→ T1R = R).

Per g = I, da 4.2.9, la matrice (d det)I = JI(det) ha coefficienti (−1)i+j det(Iij), che sono zerose i 6= j e 1 se i = j, cioe

(d det)I(X) = x11 + x22 + . . .+ xnn =: tr(X)

dove tr(X) e la traccia della matrice X. Percio:

TISL(n,R) = X ∈Mn(R) : tr(X) := x11 + x22 + . . .+ xnn = 0 ,

cioe l’algebra di Lie di SL(n,R) sono le matrici di Mn(R) con traccia nulla. Poiche SL(n,R) euna sottovarieta di GL(n,R), il calcolo fatto qui sopra mostra che Ad(g)(X) = gXg−1 per g ∈SL(n,R) e X ∈ TISL(n,R). Si noti che per g ∈ SL(n,R) si ha proprio Ad(g)(TISL(n,R)) ⊂TI(SL(n,R)) perche il polinomio caratteristico di X e uguale a quello di gXg−1 e tale polinomioe pX(λ) = ±(λn − tr(X)λn−1 + . . .).

5.1.8 La rappresentazione Aggiunta per SO(n). Lo spazio tangente TISO(n,R) delgruppo di Lie SO(n,R) si determina usando 4.2.10 e, di nuovo, 4.3.8, con A = I:

TISO(n,R) = ker(JI(F ) : Mn(R) −→ Symn(R)), X 7−→ tX +X,

cioeTISO(n,R) = X ∈Mn(R) : tX = −X = Altn(R),

lo spazio vettoriale delle matrici n × n alternanti. Per g ∈ SO(n,R) la mappa AggiuntaAd(g) ∈ End(TISO(n,R)) e ancora data da Ad(g)(X) 7→ gXg−1. Si noti che g−1 = tg perg ∈ SO(n,R) e quindi se X ∈ Altn(R) anche gXg−1 ∈ Altn(R):

t(gXg−1) = t(gX(tg)) = g(tX)(tg) = −gX(tg) (∈ Altn(R), g ∈ SO(n,R), X ∈ Altn(R)).

Si noti che per il cammino

γ : R −→ SO(2,R), τ 7−→(

cos τ −sen τsen τ cos τ

), X := γ′(0) =

(0 −11 0

)∈ TISO(2,R)

e che infatti tX = −X.

Page 86: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 86

5.2 Algebre di Lie

5.2.1 L’algebra di Lie di un gruppo di Lie. Nella sezione 5.1.5 abbiamo definito unomomorfismo di gruppi di Lie

Ad : G −→ GL(g)

e quindi otteniamo un’applicazione lineare, chiamata applicazione aggiunta,

ad := (dAd)e : TeG = g −→ TIGL(g) ∼= End(g).

Qui indentifichiamo, come al solito, lo spazio tangente in I all’aperto GL(g) dello spaziovettoriale End(g) con questo spazio vettoriale stesso.

Per calcolare l’aggiunta per sottogruppi di Lie di GL(n,R) si noti che per un camminoγ :]− ε, ε[→ GL(n,R) e ogni τ ∈]− ε, ε[ si ha γ(τ)γ(τ)−1 = I. Quindi, con γ′(0) := (dγ/dτ)(0),abbiamo γ′(0)γ−1(0) + γ(0)(γ−1)′(0) = 0. In particolare,

γ(0) = I, γ′(0) = X =⇒ (γ−1)′(0) = −X.

Per X ∈ TIGL(n,R) definito da un cammino γ (quindi con γ(0) = I, γ′(0) = X) e Y ∈ g,l’immagine di Y sotto l’endomorfismo ad(X) di g e:

ad(X)(Y ) :=(

dAd(γ(τ))(Y )dτ

)|τ=0

=(

dγ(τ)Y γ(τ)−1

)|τ=0

= γ′(0)Y γ−1(0) + γ(0)Y (γ−1)′(0)

= XY − Y X =: [X, Y ]

dove [X, Y ] e detto il commutatore di X e Y .In generale, per un gruppo di Lie, per X ∈ TeG si definisce un campo vettoriale X su G per

Xg := (dLg)e(X) doveLg : G −→ G, Lg(h) := gh.

Poiche LgLh = Lgh segue che per ogni g, h ∈ G si ha (dLg)hXh = Xgh, si dice che il campovettoriale X e invariante a sinistra. Poi si mostra che le parentesi di Lie per campi vettoriali(vedi 4.3.11) sono compatibili con la mappa ad nel senso che:

˜ad(X)(Y ) = [X, Y ],

questo ‘giustifica’ la nostra definizione [X, Y ] := ad(X)(Y ) per X, Y ∈ g. Da questa identitae dall’identita di Jacobi, oppure nel caso di sottogruppi di Lie di GL(n,R), dal semplice fattoche [X, Y ] = XY − Y X, segue che

[X, Y ] = −[Y,X], [X, [Y, Z]] = [[X, Y ], Z] + [Y, [X,Z]].

Page 87: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 87

5.2.2 Algebre di Lie. Un’algebra di Lie g e uno spazio vettoriale con un’applicazione bilinearealternante

g× g −→ g, (X, Y ) 7−→ [X, Y ]

che soddisfa l’identita di Jacobi (vedi qui sopra).Esempi di algebre di Lie sono gli spazi tangenti TeG, dove e e l’elemento neutro di un gruppo

di Lie G (vedi 5.2.1) e gli spazi vettoriali X (M) (di dimensione infinita!) dei campi vettorialisu una varieta differenziabile (vedi 4.3.11).

5.2.3 Esempio: sl(2) . L’algebra di Lie del gruppo SL(2,R)

sl(2) := W ∈M2(R) : tr(W ) = 0

ha una base data da:

H :=

(1 00 −1

), X :=

(0 10 0

), Y :=

(0 01 0

),

e un facile calcolo mostra che i commutatori sono dati da:

[X, Y ] = −[Y,X] = H, [H,X] = −[X,H] = 2X, [H,Y ] = −[Y,H] = −2Y,

(cioe XY − Y X = H ecc.) e gli altri commutatori sono zero: [X,X] = [Y, Y ] = [H,H] = 0perche [X,X] = −[X,X] ecc.

5.2.4 Rappresentazioni di algebre di Lie. Una rappresentazione di un’algebra di Lie g inV , dove V e uno spazio vettoriale di dimensione finita, e un’applicazione lineare

ρ : g −→ End(V ) t.c. ρ([X, Y ]) = ρ(X) ρ(Y )− ρ(Y ) ρ(X)

dove indica la composizione di endomorfismi di V , cioe una rappresentazione di un’algebradi Lie conserva il commutatore.

Una rappresentazione e detta irriducibile se V non ha sottospazi invarianti per g tranne 0e V , cioe se W e un sottospazio di V tale che ρ(X)w ∈ W per ogni X ∈ g e ogni w ∈ W alloraW = 0 oppure W = V .

5.2.5 La rappresentazione aggiunta. L’applicazione aggiunta di g in End(g):

ad : g −→ End(g), X 7−→ [Y −→ ad(X)(Y )] (X, Y ∈ g).

e una rappresentazione di g perche dall’identita di Jacobi [X, [Y, Z]] = [[X, Y ], Z] + [Y, [X,Z]segue

ad([X, Y ])(Z) = [[X, Y ], Z] = [X, [Y, Z]]− [Y, [X,Z]] = ad(X)(ad(Y )(Z))− ad(Y )(ad(X)(Z))

per ogni Z ∈ g, quindi ad([X, Y ]) = ad(X) ad(Y )− ad(Y ) ad(X) in End(g).

Page 88: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 88

Nel caso g = sl(2), la base X,H, Y (in questo ordine), vedi 5.2.3, da le seguente matriceper la rappresentazione aggiunta

ad(X) =

0 −2 00 0 10 0 0

, ad(H) =

2 0 00 0 00 0 −2

, ad(Y ) =

0 0 0−1 0 00 2 0

.

(usare che ad(X)(X) = [X,X] = 0, ad(X)(H) = −[H,X] = −2X, ad(X)(Y ) = [X, Y ] = Hecc.).

5.2.6 Rappresentazioni del gruppo e dell’algebra di Lie. Data una rappresentazioner : G→ GL(V ) otteniamo un’applicazione lineare

ρ := (dr)e : g −→ End(V ), ρ(X)v :=

(d

dtr(γ(t))v

)|t=0

dove γ e un cammino in G che rappresenta X ∈ TeG, cioe con γ(0) = e e γ′(0) = X. L’appli-cazione ρ e una rappresentazione dell’algebra di Lie g in V . Per mostrarlo, osserviamo primache, per g, h ∈ G si ha, in GL(V ):

ir(g)(r(h)) = r(g)r(h)r(g)−1 = r(ghg−1) = r(ig(h)), cioe ir(g) r = r ig : G→ GL(V ).

Il differenziale g→ End(V ) di questa mappa G→ GL(V ) in e ∈ G e allora

d(ir(g) r)e = d(ir(g))I (dr)e = (dr)e (dig)e, quindi Ad(r(g)) ρ = ρ Ad(g).

Adesso prendiamo il differenziale in e ∈ G dell’applicazione

G −→ End(V ), g 7−→ Ad(r(g)) ρ = ρ Ad(g).

Usando un cammino γ in G con γ(0) = e, γ′(0) = X, troviamo per ogni Y ∈ g:(d

dtAd(r(γ(t)))(ρ(Y ))

)t=0

=

(d

dtρ(Ad(γ(t))(Y ))

)t=0

.

Con la definizione di Ad, nel caso G ⊂ GL(n), si ottiene:(d

dtr(γ(t))ρ(Y )r(γ(t)−1)

)t=0

=

(d

dtρ(γ(t)Y γ(t)−1)

)t=0

.

Il lato sinistro e [ρ(X), ρ(Y )] e poiche l’applicazione ρ e continua il lato destro e ρ([X, Y ]).Quindi ρ e una rappresentazione dell’algebra di Lie g:

[ρ(X), ρ(Y )] = ρ([X, Y ]).

5.2.7 L’applicazione esponenziale. Dato un X ∈ g, X 6= 0, si puo mostrare che esiste ununico cammino

γ = γX : R −→ G, t.c. γ∗ = X, γ(s+ t) = γ(s)γ(t) (∀s, t ∈ R),

Page 89: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 89

cioe γ e omomorfismo di gruppi di Lie.L’applicazione esponenziale e definita da:

exp : g −→ G, exp(tX) := γX(t),

quindi la restrizione di exp alla retta < X >⊂ g e un omomorfismo per ogni X ∈ g. In piu siha che

(d exp)0 : T0g = g −→ TeG = g

e l’identita. L’applicazione exp e l’unica applicazione con queste due proprieta. Se G e connesso,si puo mostrare che G e generato da exp(U), dove U ⊂ g e un intorno aperto di 0 ∈ g.

Se G e un sottogruppo di Lie di GL(n,R), allora g ⊂M(n,R) e si ha la formula esplicita:

exp tX =∞∑k=0

tkXk

k!, (X ∈M(n,R) = TeGL(n,R)).

Si noti che si ha proprio γ∗ := (d/dt) exp tX)t=0 = X.In generale non vale exp(X + Y ) = (expX)(expY ) perche XY 6= Y X. La formula di

Campbell-Baker-Haussdorf da una formula per (expX)(expY ) come exp di una somma dicommutatori tra X e Y :

(expX)(expY ) = exp(X + Y + (1/2)[X, Y ] + (1/12)[X, [X, Y ]]− (1/12)[Y, [X, Y ]] + . . .).

Per calcolare l’exp e spesso utile usare che exp(SXS−1) = S(exp(X))S−1 (che segue dallaserie per exp), quindi la forma di Jordan di X determina essenzialmente exp(X).

Si puo mostrare che poiche (d exp)0 e un isomorfismo, l’immagine della mappa esponenzialecontiene un aperto U di G tale che e ∈ U . La formula qui sopra mostra che il prodotto µ inun tale aperto di G e determinato dal prodotto nell’algebra di Lie g. Questo ci permette dimostrare che un’algebra di Lie g di dimensione finita determina in modo unico un gruppo diLie G che e connesso e semplicemente connesso. Queste condizioni su G sono importanti, peresempio l’algebra di Lie g = R (con prodotto banale) e l’algebra di Lie di R∗ = R − 0 (nonconnesso), di R/Z (connesso ma non semplicemente connesso) e di R (connesso e semplicementeconnesso e l’unico tale G con algebra di Lie g, a meno di isomorfismo di gruppi di Lie).

5.2.8 Esempi dell’applicazione esponenziale. Si ha:

exp(tX) = diag(etλ1 , . . . , etλn), se X = diag(λ1, . . . , λn) ∈M(n,R)

perche Xk = diag(λk1, . . . , λkn).

Se X ∈ M(n,R) e nilpotente, allora XN = 0 per un certo N e quindi exp(X) = I + X +X2/2! + . . .+XN/N !, una somma finita. Per esempio,

X =

0 1 00 0 20 0 0

, X2 =

0 0 20 0 00 0 0

, X3 = 0,

Page 90: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 90

quindi si ha:

exp(tX) = I + tX + t2X2/2 =

1 t 2t2

0 1 2t0 0 1

.

Sia (vedi 5.1.8)

X =

(0 −11 0

)∈ TISO(2,R), si noti: X2 = −I, X2k = (−1)kI, X2k+1 = (−1)kX.

L’esponenziale di X e allora

exp(tX) =∑

nXn

n!

=(∑∞

k=0(−1)kt2k

(2k)!

)I +

(∑∞k=0

(−1)kt2k+1

(2k+1)!

)X

= (cos t)I + (sen t)X

=

cos t −sen t

sen t cos t

.

5.2.9 Sottogruppi e sottoalgebre di Lie. Sia G ⊂ G′ un sottogruppo di Lie, allorag = TeG ⊂ TeG

′ = g′ e un sottospazio vettoriale. Il prodotto di Lie in g e allora la restrizionedel prodotto di Lie in g′: visto che ghg−1 ∈ G per ogni g, h ∈ G si ha Ad(g)(Y ) ∈ g per ogniY ∈ g e g ∈ G. Questa poi implica che ad(X)(Y ) = [X, Y ] ∈ g per ogni X, Y ∈ g. Si dice cheg e una sottoalgebra di Lie di h.

In particolare, se ρ : G→ GL(V ) e una rappresentazione di G, allora ρ(G) e un sottogruppodi Lie di GL(V ) e Teρ(G) = (dρ)eg. Quindi (dρ)eg e un sottoalgebra di Lie di End(V).

In generale, una sottoalgebra di Lie h ⊂ g non determina un sottogruppo di Lie H di G.Si puo invece mostrare che h determina sempre un sottogruppo di Lie immerso f(H) ⊂ G(dove f : H → G e un omomorfismo di gruppi di Lie) tale che l’immagine del differenziale(df)e : TeH → TeG = g e h ⊂ g. In piu, l’iniettivita di f implica che (df)e e iniettiva, quindiTeH ∼= h.

5.2.10 Sottogruppi normali ed ideali. Supponiamo che H sia un sottogruppo di Lienormale di G, cioe ghg−1 ∈ H per ogni g ∈ G, h ∈ H. Allora Ad(g)(Y ) ∈ h per ogni g ∈ G,Y ∈ h e percio ad(X)(Y ) = [X, Y ] ∈ h per ogni X ∈ g e Y ∈ h (in questo senso h ‘assorbe’ g).Si dice che h e un ideale di g.

Se G e un gruppo di Lie e H e un sottogruppo di Lie normale chiuso, allora anche G/He un gruppo di Lie e lo studio di G equivale a studiare H, G/H e i possibili gruppi di Lie G′

che hanno H come sottogruppo normale e G/H come gruppo quoziente (si dice che G′ e unaestensione di G/H con H).

Page 91: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 91

5.3 Rappresentazioni.

5.3.1 Rappresentazioni in prodotti tensoriali. Siano r : G→ GL(V ) e s : G→ GL(W )rappresentazioni di un gruppo di Lie in spazi vettoriali. Allora si ha una rappresentazione diG nel prodotto tensoriale:

r ⊗ s : G −→ GL(V ⊗W ), v ⊗ w 7−→ (r(g)v)⊗ (s(g)w),

come si verifica facilmente.La rappresentazione r ⊗ s di G definisce una rappresentazione dell’algebra di Lie g

d(r ⊗ s)e : g −→ End(V ⊗W ).

Si ha (si veda 5.2.6) usando la regola di Leibnitz:

d(r ⊗ s)e(X)(v ⊗ w) =

(d

dtr(γ(t))v ⊗ s(γ(t))w

)|t=0

= (ρ(X)v)⊗ w + v ⊗ σ(X)w,

dove γ e un cammino in G con γ(0) = e, γ′(0) = X e

ρ = (dr)e : g −→ End(V ), σ = (ds)e : g −→ End(W )

sono le rappresentazioni dell’algebra di Lie di G definite da r, s.

5.3.2 Le rappresentazioni V ⊗ V e V ⊗ V ∗. La rappresentazione standard r di GL(V ) suV induce una rappresentazione r2 := r ⊗ r

r2 : GL(V ) −→ GL(V ⊗ V ), r2(A)(v ⊗ w) = (Av)⊗ (Aw).

Sia e1, . . . , en una base V . Un modo comodo per vedere questa rappresentazione e tramite lamappa lineare

V ⊗ V −→ Mn(R), v ⊗ w 7−→ v(tw),

dove per v =∑viei, w =

∑wiei ∈ V il prodotto v(tw) = (viwj) e una matrice n × n. In

particolare otteniamo un isomorfismo di spazi vettoriali V ⊗ V ∼= Mn(R). Visto che (Av) ⊗(Aw) 7→ Av(tw)(tA) otteniamo che la rappresentazione r puo anche essere data da

r2 : GL(V ) −→ GL(Mn(R)), r2(A)M = AM(tA).

La rappresentazione ρ2 := (dr2)e dell’algebra di Lie gl(n) = Mn(R) di GL(V ) e data da

ρ2 := (dr2)e : gl(n) −→ End(Mn(R)), ρ2(X)(M) = XM +M tX.

Si verifica che il sottospazio delle matrici simmetriche S2V di Mn(R) (cioe le M con tM = M)e un sottospazio invariante (per r2 e per ρ2), similmente anche il sottospazio delle matriciantisimmetriche A2V di Mn(R) (cioe le M con tM = −M) e un sottospazio invariante e si haMn(R) = S2V ⊕ A2V .

Page 92: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 92

La rappresentazione standard r di GL(V ) su V induce la rappresentazione controgradiente(vedi 1.1.12)

s : GL(V ) −→ GL(V ∗) ∼= GL(n,R), s(A) = tA−1,

si verifica che la rappresentazione σ := (dr)e dell’algebra di Lie gl(n) di GL(V ) e data da

σ := (dr)e : gl(n) −→ End(V ) ∼= Mn(R), σ(X) = −tX.

Il prodotto tensoriale

r ⊗ s : GL(V ) −→ GL(V ⊗ V ∗), (r ⊗ s)(A)(v ⊗ wl) = (Av)⊗ (tA−1wl),

dove, per l =∑liεi ∈ V ∗ e εi la base duale, wl e il vettore colonna con coefficienti (wl)i = li,

cioe wl = tl se l e visto come matrice con una sola riga e n colonne. L’identificazione naturaleV ⊗ V ∗ ∼= End(V ) (tale che (v ⊗ l)(x) = l(x)v, cioe v ⊗ l 7→ vl = v(twl) vedi 1.1.10) seguitodall’isomorfismo End(V ) ∼= Mn(R) da allora (Av) ⊗ (tA−1wl) 7→ A(vtwl)A

−1. Otteniamo cosıla descrizione seguente di r ⊗ s:

r ⊗ s : GL(V ) −→ End(V ) ∼= Mn(R), (r ⊗ s)(A)(M) = AMA−1,

che e infatti la ben nota formula per M dopo il cambio di base dato da A.La rappresentazione ρ⊗σ := (d(r⊗ s))e dell’algebra di Lie gl(n) = Mn(R) di GL(V ) e data

da

ρ⊗ σ := (d(r ⊗ s))e : gl(n) −→ End(Mn(R)), ρ⊗ σ(X)(M) = XM −MX.

Si verifica che il sottospazio delle matrici con traccia zero sl(n) e un sottospazio invariante,anche il sottospazio delle matrici D = λI : λ ∈ R in Mn(R) e un sottospazio invariante e siha Mn(R) = sl(n)⊕D.

5.3.3 Omomorfismo di rappresentazioni. Un omomorfismo tra due rappresentazioniρ : g→ End(V ) e σ : g→ End(W ) di un’algebra di Lie g e un’applicazione lineare

S : W −→ V tale che ρ(X)S = Sσ(X) (∀X ∈ g).

Si verifica facilmente che ker(S) e un sottospazio invariante di W e che im(S) e un sottospazioinvariante di V . Infatti, se w ∈ ker(S) e X ∈ g allora

S(σ(X)w) = ρ(X)(Sw) = ρ(X)0 = 0 quindi anche σ(X)w ∈ ker(S),

e similmente, se v ∈ im(S) allora v = Sw per un w ∈ W e:

ρ(X)v = ρ(X)Sw = S(σ(X)w) quindi anche ρ(X)v ∈ im(S).

Le due rappresentazioni sono dette isomorfe se esiste un isomorfismo S : W → V tale che

ρ(X) = Sσ(X)S−1 : V −→ V

Page 93: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 93

per ogni X ∈ g. Per esempio, se V = W = Rn, due rappresentazioni sono isomorfe se e solo seuna e ottenuta dall’altra tramite un cambio di base di Rn.

Due rappresentazioni r : G → GL(V ) e s : G → GL(W ) di un gruppo di Lie G sono detteisomorfe se esiste un isomorfismo S : W → V tale che

r(g) = Ss(g)S−1 : V −→ V

per ogni g ∈ G. Si noti che se r, s sono isomorfe, allora anche le rappresentazioni delle algebredi Lie che definiscono, (dr)0 e (ds)0, sono isomorfe.

Una proprieta importante di un omomorfismo S di rappresentazioni e che sia il nucleosia l’immagine di S sono sottospazi invarianti. Lo mostriamo per un omomorfismo tra duerappresentazioni ρ : g → End(V ) e σ : g → End(W ) di un algebra di Lie g, il caso di ungruppo di Lie G e analogo.

Per mostrare che ker(S) e un sottospazio invariante di W prendiamo un w ∈ ker(S) (cioeSw = 0) e un X ∈ g e verifichiamo che anche σ(X)w ∈ ker(S):

S(σ(X)w) = ρ(X)Sw = ρ(X)0 = 0,

quindi σ(X)w ∈ ker(S) come desiderato. Similmente, per mostrare che im(S) e un sottospazioinvariante di V prendiamo un v ∈ im(S) (cioe v = Sw per un certo w ∈ W ) e un X ∈ g everifichiamo che anche ρ(X)v ∈ im(S):

ρ(X)v = ρ(X)Sw = S(σ(X)v),

quindi ρ(X)v ∈ im(S) come desiderato.

5.3.4 Esempio: una rappresentazione di SL(2,R). Consideriamo la rappresentazione r,di dimensione infinita, di SL(2,R) sullo spazio C∞(R2) delle funzioni lisce su R2 data da

r : SL(2,R) −→ Aut(C∞(R2)), (r (A)F )(v) := F (tAv) (v ∈ R2).

Si noti che:

(r(A)(r(B)F )))(v) = (r(B)F )(tAv) = F (tB(tAv)) = F (t(AB)v) = (r(AB)F )(v),

quindi r e una rappresentazione.La rappresentazione dell’algebra di Lie associata e:

ρ : sl(2) −→ End(C∞(R2)), (ρ(Z)F )(v) :=d

dt(r(tγ(t))F )(v)|t=0 (Z ∈ sl(2)),

dove γ e un cammino in SL(2,R) con γ(0) = I, γ′(0) = Z. In particolare, con la base X, Y,Hdi sl(2) come in 5.2.3, si possono prendere i cammini γ(t) = exp(tX) ecc:

exp(tX) =

(1 t0 1

), exp(tY ) =

(1 0t 1

), exp(tH) =

(et 00 e−t

).

Page 94: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 94

Allora troviamo, con v = (x, y):

(ρ(X)F )(v) =d

dt(F (x, tx+ y))|t=0 = (x∂y)F (v),

(ρ(Y )F )(v) =d

dt(F (x+ ty, y))|t=0 = (y∂xF )(v),

(ρ(H)F )(v) =d

dt(F (etx, e−ty))|t=0 = ((x∂x − y∂y)F )(v).

L’algebra di Lie di sl(2) ha dunque una rappresentazione nei campi vettoriali su R2. Lasciamoal lettore la verifica che vale proprio [X, Y ] = [y∂x, x∂y] = x∂x − y∂y = H ecc.

5.3.5 La rappresentazione V (n) di sl(2). Sia F un polinomio omogeneo di grado n, cioeF (λx, λy) = λnF (x, y) per ogni λ ∈ R. Allora si verifica che anche r(A)F e un polinomioomogeneo di grado n. Percio

R[x, y]n := F ∈ R[x, y] : F (λx, λy) = λnF (x, y) ∀λ ∈ R

e un sottospazio vettoriale di C∞(R2) che e invariante sotto r(SL(2,R)) e percio e ancheinvariante sotto ρ(sl(2)).

La restrizione di ρ a questo sottospazio da una rappresentazione

ρn : sl(2) −→ End(R[x, y]n), Z 7−→ ρn(Z) = ρ(Z)|R[x,y]n .

Una base di R[x, y]n e data dai monomi

xn, xn−1y, . . . xn−aya, . . . yn, quindi dim R[x, y]n = n+ 1.

Si noti che:

ρn(H)(xn−aya) = (x∂x − y∂y)(xn−aya) = (n− a)xn−aya − axn−aya = (n− 2a)xn−aya,

quindi xn−aya ∈ V (n)n−2a, e in modo simile:

ρn(X)(xn−aya) = x∂y(xn−aya) = axn−a+1ya−1,

ρn(Y )(xn−aya) = y∂x(xn−aya) = (n− a)xn−a−1ya+1.

In particolare, ogni vettore della base e un autovettore per ρn(H), con autovalori n, n− 2, n−4 . . . ,−n, in piu ρn(X)(xn) = 0 e R[x, y]n e generato dalle ρn(Y )a(xn) = cax

n−aya con ca =n(n− 1) . . . (n− a+ 1) 6= 0 per a = 1, . . . , n.

5.4 Algebre di Lie semplici

5.4.1 Algebre di Lie semplici e semi-semplici. Un’algebra di Lie g e detta semplice sedim g > 1 e se g non ha ideali tranne 0 e g. Cioe, se V ⊂ g e un sottospazio vettoriale taleche [x, v] ∈ V per ogni x ∈ g e v ∈ V allora V = 0 oppure V = g.

Page 95: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 95

Un’algebra di Lie e detta semi-semplice se e somma diretta di algebre di Lie semplici.

5.4.2 Esempio. L’algebra di Lie del gruppo SL(n,R)

sl(n) := W ∈Mn(R) : tr(W ) = 0

e semplice per ogni n ≥ 2, qui lo dimostriamo per n = 2.Con la base X, Y,H di sl(2) come in 5.2.3, i commutatori sono dati da:

[X, Y ] = −[Y,X] = H, [H,X] = −[X,H] = 2X, [H,Y ] = −[Y,H] = −2Y,

e gli altri commutatori sono zero: [X,X] = [Y, Y ] = [H,H] = 0.Sia W ∈ sl(2) la matrice

W = aH + bX + cY =

(a bc −a

)(∈ sl(2)).

Allora si verifica:

[X,W ] =

(0 10 0

)(a bc −a

)−(a bc −a

)(0 10 0

)=

(c −2a0 −c

),

e quindi, come sopra, ma con [X,W ] invece di W :

[X, [X,W ]] =

(0 −2c0 0

).

Sia adesso V ⊂ sl(2), V 6= 0, uno sottospazio vettoriale tale che [Z,W ] ∈ V per ogniZ ∈ sl(2) e W ∈ V , mostriamo che V = sl2 e quindi sl2 e semplice.

Sia W ∈ V , W = aH + bX + cY 6= 0 come sopra, quindi uno dei coefficienti a, b, c e nonzero.

Se c 6= 0, abbiamo [X,W ] ∈ V , e poi [X, [X,W ]] ∈ V . Percio −2cX ∈ V e quindi X ∈ V .Inoltre [Y,X] = −H ∈ V , e poi [Y,H] = 2Y ∈ V . Ma allora V contiene una base di sl2 e percioV = sl2.

Nel caso c = 0, a 6= 0 si ha [X,Z] = −2aX ∈ V e quindi X ∈ V , come sopra si deduce cheV = sl(2). Infine, se c = a = 0, b 6= 0 si ha Z = bX ∈ V e, ancora una volta, V = sl(2).

Ne concludiamo che V = sl2 se V 6= 0 e quindi sl2 e un’algebra di Lie semplice.

5.4.3 Irriducibilita della rappresentazione aggiunta. Si ad la rappresentazione aggiuntadi g in End(g) (vedi 5.2.5):

ad : g −→ End(g), X 7−→ [Y −→ ad(X)(Y )] (X, Y ∈ g).

Se g e semplice (vedi 5.4.1) allora ad e una rappresentazione irriducibile. Infatti, se W ⊂ g

e un sottospazio invariante, allora ad(X)(Y ) ∈ W per ogni X ∈ g e Y ∈ W implica che W eun ideale di g. Poiche g e semplice si ha allora W = 0 oppure W = g.

Page 96: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 96

5.4.4 Il nucleo di una rappresentazione. Sia ρ : g → End(V ) una rappresentazione diun’algebra di Lie. Il nucleo ker(ρ) e un’ideale di g perche se X ∈ g e Y ∈ ker(ρ) si ha

ρ([X, Y ]) = ρ(X)ρ(Y )− ρ(Y )ρ(X) = ρ(X) 0− 0 ρ(X) = 0,

quindi [X, Y ] ∈ ker(ρ). In particolare, se g e semplice, allora ogni rappresentazione di g e 0(cioe ρ(X) = 0 per ogni X ∈ g) oppure ρ e iniettiva.

5.4.5 La decomposizione di Jordan. Per studiare le rappresentazioni di un’algebra diLie g si usano gli autospazi di endomorfismi ρ(X) per X ∈ g. In generale, se V e uno spaziovettoriale complesso di dimensione finita e X ∈ End(V ), lo spazio V non e la somma direttadegli autospazi di X. Per esempio, la matrice X di 5.4.2 ha autovalore 0 (con moltiplicita 2),ma l’autospazio corrispondente, generato da (1, 0), ha soltanto dimensione 1.

Un endomorfismo ha una decomposizione di Jordan, cioe esiste una base di V tale che lamatrice A dell’endomorfismo e una matrice ‘triangolare superiore’. Si puo fare tale decom-posizione in modo che la matrice A sia la somma di una matrice diagonale As e una matricestrettemente triangolare superiore An (cioe (An)kl = 0 se k ≤ l, in particolare XN

n = 0 perN ≥ dimV ) e:

A = As + An, AsAn = AnAs.

Un risultato fondamentale e che se g e un algebra di Lie semi-semplice e X ∈ g allora cisono (unici) Xs, Xn ∈ g tali che

X = Xs +Xn e tali che ρ(X)s = ρ(Xs), ρ(X)n = ρ(Xn)

per ogni rappresentazione ρ : g→ End(V ) su uno spazio vettoriale V di dimensione finita.In particolare, sia g e semplice e ρ una rappresentazione non-banale. Se H ∈ g e tale che

ρ(H) e diagonalizzabile, allora ρ(H)s = ρ(H) e ρ(H)n = 0. Poiche ρ e iniettiva, si ha allora cheH = Hs e Hn = 0. Percio in ogni rappresentazione σ di g si ha che σ(H) e diagonalizzabile.

Per esempio, l’inclusione sl(2) ⊂ M2(R) e una rappresentazione di sl(2) nella quale He diagonale, quindi H = Hs. Dal risultato citato si ha allora che in ogni rappresentazioneρ di sl(2) in uno spazio vettoriale complesso V di dimensione finita, l’endomorfismo ρ(H) ediagonalizzabile, cioe:

V = ⊕λ∈CVλ, Vλ = v ∈ V : ρ(H)v = λv .

Similmente, X = Xn e quindi esiste un N (che dipende dalla rappresentazione!) tale cheρ(X)N = 0.

5.4.6 Completa riducibilita di rappresentazioni. Sia ρ : g → End(V ) una rappre-sentazione di un’algebra di Lie in uno spazio vettoriale V . La rappresentazione ρ e dettacompletamente riducibile se

V = ⊕i∈IWi

dove ogni Wi e una sottorappresentazione irriducibile.

Page 97: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 97

Un risultato fondamentale di H. Weyl dice che se g e semi-semplice, allora ogni rappresen-tazione di g in uno spazio vettoriale di dimensione finita e completamente riducibile. In piu, lesottorappresentazioni irriducibili sono determinate in modo unico, cioe se ⊕Wi

∼=∑W ′j dove

gli Wi,W′j sono irriducibili, allora esiste una permutazione σ degli indici tale che Wi

∼= W ′σ(j).

Questo risultato implica anche che se W ⊂ V e una sottorappresentazione irriducibile, alloraW ∼= Wi per un certo i.

5.5 Le rappresentazioni irriducibili dell’algebra di Lie sl(2)

5.5.1 Le rappresentazioni di sl(2). Si studi una rappresentazione qualunque di sl(2) inuno spazio vettoriale V . Da questo studio e facile ottenere tutte le rappresentazioni irriducibilidi sl(2). Esse sono parametrizzate da un intero n ∈ Z≥0, detto il peso piu alto della rapp-resentazione. La rappresentazione ρn con peso piu alto n e in uno spazio vettoriale V (n) didimensione n+ 1.

5.5.2 Rappresentazioni di sl(2). Sia ρ : sl(2)→ End(V ) una rappresentazione dell’algebradi Lie sl(2) in uno spazio vettoriale di dimensione finita. Sia X, Y,H la base di sl(2) data in5.4.2. Poiche ρ e una rappresentazione abbiamo (in End(V ))

[ρ(X), ρ(Y )] = ρ(H), [ρ(H), ρ(X)] = 2ρ(X), [ρ(H), ρ(Y )] = −2ρ(Y ).

In particolare, vale ρ(H)ρ(X) = ρ(X)ρ(H) + ρ([H,X]) = ρ(X)ρ(H) + 2ρ(X) ecc.

5.5.3 Pesi e spazi di peso di una rappresentazione di sl(2). Consideriamo gli auto-valori (detti pesi di ρ) e autospazi (detti spazi di pesi, (ingl: weight spaces)) dell’applicazionelineare ρ(H) : V → V . Mostreremo che questi autovalori sono interi, ma per adesso consideri-amo un autovalore qualunque λ ∈ C di ρ(H). Nella complessificazione VC di V consideriamol’autospazio corrispondente

Vλ := v ∈ VC : ρ(H)v = λv ,

Per adesso non sfruttiamo il risultato generale sulla forme di Jordan di ρ(H) di 5.4.5.

5.5.4 L’azione di X e Y su Vλ. Un primo risultato e che gli endomorfismi ρ(X), ρ(Y ) di Vtrasformano un autospazio di ρ(H) in un altro:

ρ(X)Vλ ⊂ Vλ+2, ρ(Y )Vλ ⊂ Vλ−2,

cioe ρ(X) alza il peso di 2 mentre ρ(Y ) l’abbassa di 2. Questo segue dal calcolo seguente: perv ∈ Vλ si ha

ρ(H)(ρ(X)v) = (ρ(X)ρ(H))v + ρ([H,X])v = ρ(X)(λv) + 2ρ(X)v = (λ+ 2)ρ(X)v,

e similmente ρ(H)(ρ(Y )v) = (λ− 2)ρ(Y )v.

Page 98: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 98

5.5.5 Vettori massimali. Sia v ∈ Vλ, v 6= 0. Allora ρ(X)kv e un autovettore di ρ(H) conautovalore λ+ 2k. Poiche V ha dimensione finita e i numeri complessi λ, λ+ 2, λ+ 4, . . . sonodistinti, esiste un k tale che ρ(X)kv 6= 0, ρ(X)k+1v = 0.

Un vettore v ∈ V e detto vettore massimale (per la rappresentazione ρ) se v e un autovettoredi ρ(H) e se ρ(X)v = 0.

Come visto, ogni autovettore v, v 6= 0, di ρ(H) da un vettore massimale, non zero, di V .In particolare, ogni rappresentazione V di sl(2) (piu preciso: ogni rappresentazione ρ : sl(2)→End(V )) ha vettori massimali.

5.5.6 Vettori massimali e sottorappresentazioni di V . Dato un vettore massimalev ∈ Vλ, v 6= 0, mostriamo che il sottospazio

W := 〈v, ρ(Y )v, ρ(Y )2v, . . . 〉 (⊂ V )

e invariante per sl(2), quindi W e una sottorappresentazione di V .Per costruzione si ha ρ(Y )w ∈ W , per ogni w ∈ W . Poi ρ(H)w ∈ W per ogni w ∈ W perche

ρ(H)(ρ(Y )lv) = (λ− 2l)(ρ(Y )lv) ∈ W . Poiche v e massimale, ρ(X)v = 0. Usando [X, Y ] = Hsi ha

ρ(X)(ρ(Y )v) = ρ(Y )(ρ(X)v) + ρ(H)v = 0 + λv ∈ W.Per induzione su k, supponendo che ρ(X)(ρ(Y )k−1v) ∈ W , troviamo allora:

ρ(X)(ρ(Y )kv) = ρ(Y )(ρ(X)ρ(Y )k−1v) + ρ(H)(ρ(Y )k−1v) ∈ W,

perche sia ρ(X)ρ(Y )k−1v che ρ(H)(ρ(Y )k−1v) stanno in W . Quindi W e invariante perρ(Y ), ρ(H) e ρ(X) e percio e invariante per sl(2).

Dato un vettore massimale v di una rappresentazione ρ : sl(2)→ End(W ) abbiamo quindicostruito un sottospazio W di V con v ∈ W tale che la rappresentazione ρ definisce unarappresentazione sl(2)→ End(W ) (per essere precisi: l’immagine di w ∈ W sotto M ∈ sl(2) eρ(M)w). Si dice che W e la sottorappresentazione di V generata dal vettore massimale v.

5.5.7 La sottorappresentazione W . Sia W la sottorappresentazione di V generata da unvettore massimale v ∈ Vλ (vedi 5.5.6). Se dimW = n+ 1, una base di W e data dalle ρ(Y )kv,con k = 0, 1, . . . , n (questi vettori sono indipendenti perche ρ(H)ρ(Y )kv = (λ− 2k)ρ(Y )kv). Inparticolare, ρ(Y )nv 6= 0 e ρ(Y )n+1v = 0.

L’azione di ρ(Y ) e ρ(H) su questa base sono semplici da descrivere:

ρ(H)ρ(Y )kv = (λ− 2k)ρ(Y )kv, ρ(Y )ρ(Y )kv =

ρ(Y )k+1v k < n,

0 se k = n.

Adesso mostriamo che

ρ(X)ρ(Y )kv =

0 se k = 0,

ckρ(Y )k−1v 1 ≤ k ≤ n,dove ck = kλ− k(k − 1).

Abbiamo gia visto i casi k = 0, 1:

ρ(X)v = 0, ρ(X)(ρ(Y )v) = ρ(Y )(ρ(X)v) + ρ(H)v = λv.

Page 99: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 99

Usando questo, troviamo:

ρ(X)(ρ(Y )2v) = ρ(Y )(ρ(X)ρ(Y )v) + ρ(H)(ρ(Y )v)= ρ(Y )(λv) + (λ− 2)(ρ(Y )v)= (λ+ (λ− 2))(ρ(Y )v),

quindi c2 = 2λ − 2. Poiche ρ(X)(ρ(Y )kv) = ρ(Y )(ρ(X)ρ(Y )k−1v) + ρ(H)(ρ(Y )k−1v) troviamoin generale:

ρ(X)(ρ(Y )kv) = (λ+ (λ− 2) + . . .+ (λ− 2(k − 1)))ρ(Y )k−1v

= (kλ− 2(1 + 2 + . . .+ (k − 1)))ρ(Y )k−1v

= (kλ− k(k − 1))ρ(Y )k−1v.

In particolare, le matrici di ρ(H), ρ(Y ) e ρ(X) rispetto alla base v, ρ(Y )v, . . . , ρ(Y )nv di Wsono determinate in modo unico dal peso λ di v e dalla dimensione n+ 1 di W .

5.5.8 I pesi sono interi. Mostriamo che il peso λ del vettore massimale v e un intero:

λ ∈ Z≥0, in piu dimW = λ+ 1,

in particolare, ogni autovalore λ− 2k di ρ(H) su W e un intero.Poiche ρ(Y )n+1v = 0 otteniamo:

0 = ρ(X)ρ(Y )n+1v = cn+1ρ(Y )nv.

Dato che ρ(Y )nv 6= 0 si ha cn+1 = 0:

0 = cn+1 = (n+ 1)λ− (n+ 1)n =⇒ λ = n.

Gli n+ 1 autovalori, i pesi, di ρ(H) sullo spazio n+ 1-dimensionale W sono allora gli interin, n− 2, n− 4, . . . , n− 2n = −n, ognuno con molteplicita 1:

W = ⊕nk=0Wn−2k, Wµ := w ∈ W : ρ(H)w = µw dimWµ = 1.

Una base di Wn−2k e data da ρ(Y )kv, quindi ρ(Y ) : Wn−2k → Wn−2(k+1) e un isomorfismo,tranne se k = n (in quel caso Wn−2(k+1) = 0). In piu, abbiamo visto che per k = 1, . . . , n

ρ(X)(ρ(Y )kv) = ckρ(Y )k−1v con ck 6= 0 (k = 1, . . . , n)

quindi in questi casi ρ(X) : Wn−2k → Wn−2(k−1) e un isomorfismo e ρ(X)Wn = 0 perche v ∈ Wn

e un vettore massimale. Segue che ker ρ(X) = Wn. In particolare, ogni vettore massimale inW e un moltiplo di v.

Adesso non e difficile verificare che le matrici che abbiamo trovato per ρ(X), ρ(Y ) e ρ(H)rispetto alla base ρ(Y )kv, k = 0, . . . , n, di W , definiscono una rappresentazione di sl(2). In5.3.5 si dara un’altra dimostrazione.

Page 100: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 100

5.5.9 La sottorappresentazione W e irriducibile. Sia W ′ ⊂ W un sottospazio sl(2)-invariante con W ′ 6= 0. Prendiamo un w ∈ W ′, w 6= 0. Allora esiste un l ≥ 0 tale cheρ(X)lw 6= 0 ma ρ(X)l+1w = 0. Per quanto visto prima, si ha allora ρ(X)lw = cv, dove v eil vettore massimale e c ∈ C, c 6= 0. Poiche W ′ e sl(2)-invariante, si ha allora v ∈ W ′ e poiρ(Y )kv ∈ W ′ per ogni k ≥ 0, quindi W ′ = W . In questo modo abbiamo mostrato che gli unicisottospazi sl(2)-invarianti in W sono 0 e W , e quindi la rappresentazione di sl(2) in End(W )e irriducibile.

5.5.10 La rappresentazione irriducibile V (n) di sl(2). Sia adesso V una rappresen-tazione irriducibile di sl(2). La scelta di un vettore massimale non-zero v ∈ V definisce unasottorappresentazione non-banale W di V . Poiche V e irriducibile, V = W (ed il vettoremassimale e quindi unico a meno di moltiplicazione per uno scalare non nullo).

Poiche W ha una base data dalle vk := ρ(Y )kv, 0 ≤ k ≤ n dove ρ(H)v = nv, e poiche leapplicazioni ρ(Y ), ρ(H) e ρ(X) rispetto a questa base sono state determinate in modo unico,tale rappresentazione e unica. Si puo verificare che queste applicazioni definiscono davvero unarappresentazione (oppure vedi 5.3.5). Quindi esiste un’unica rappresentazione irriducibile didimensione n+ 1 di sl(2), scritto V (n), e anche:

ρn : sl(2) −→ End(V (n)).

La rappresentazione V (n) ha allora pesi λ = n, n − 2, . . . ,−n, il peso piu alto e n e ognispazio di peso V (n)λ ha dimensione 1.

5.6 Rappresentazioni di sl(2).

5.6.1 Esempi. La rappresentazione ρ0 e quella banale: ρ(Z) = 0 per ogni Z ∈ sl(2).La rappresentazione ‘identita’ e ρ1 : sl(2) →M2(R) e si noti che gli autovalori di ρ1(H) = H

sono proprio 1 e 1− 2 = −1.Poi c’e la rappresentazione aggiunta ad : sl(2) → End(sl(2)) ∼= M3(R) (vedi anche 5.2.5).

Poiche X,H, Y sono una base di sl(2) e poiche

ad(H)(X) = [H,X] = 2X, ad(H)(H) = [H,H] = 0, ad(H)(Y ) = [H,Y ] = −2Y

si ha ad(H) = diag(2, 0,−2), in particolare, ad(H) ha autovalori 2, 2 − 2 = 0, 2 − 4 = −2.Inoltre, sl(2) ha base di autovettori

X, ad(Y )(X) = [Y,X] = −H, ad(Y )2(X) = [Y, [Y,X]] = [Y,−H] = 2Y

e la dimensione della rappresentazione irriducibile ad e 2 + 1 = 3.

5.6.2 La formula di Clebsch-Gordan. Studiamo ora la decomposizione del prodottotensoriale di due rappresentazioni irriducibili di sl(2). Per la classificazione ottenuta in 5.5.10,dobbiamo considerare la rappresentazione

ρ : sl(2) −→ V (n)⊗ V (m), ρ(Z)(v ⊗ w) = (ρn(Z)v)⊗ w + w ⊗ (ρm(Z)w)

Page 101: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 101

dove Z ∈ sl(2) e con n,m ∈ Z≥0 di dimensione (n+1)(m+1). La rappresentazione ρ si decom-pone, in modo unico, (vedi 5.4.6) in rappresentazioni irriducibili. Poiche le rappresentazioniirriducibili sono determinate dai loro pesi, basta considerare questi.

Se v ∈ V (n) e w ∈ V (m) sono autovettori di ρn(H) e ρm(H), con autovalori λ, µrispettivamente, allora (vedi 5.3.1):

ρ(H)(v ⊗ w) = (ρn(H)v)⊗ w + v ⊗ (ρm(H)w) = λ(v ⊗ w) + µ(v ⊗ w) = (λ+ µ)(v ⊗ w).

Quindi il prodotto tensoriale di due autovettori e un autovettore. Poiche V (n) e V (m) sonosomma diretta di spazi peso troviamo allora che gli spazi pesi di V (n)⊗ V (m) sono:

(V (n)⊗ V (m))ν = ⊕λ+µ=νV (n)λ ⊗ V (m)µ.

Poiche i pesi di V (n) e V (m) sono n, n− 2, . . . , n− 2k, . . . ,−n e m,m− 2, . . . ,m− 2l, . . . ,−mi pesi di V (n)⊗V (m) sono allora gli (n+ 1)(m+ 1) interi nella tabella n+ 1×m+ 1 qui sotto:

n+m n+ (m− 2) . . . n+ (m− 2l) . . . n−m(n− 2) +m (n− 2) + (m− 2) . . . (n− 2) + (m− 2l) . . . (n− 2)−m

......

......

(n− 2k) +m (n− 2k) + (m− 2) . . . (n− 2k) + (m− 2l) . . . (n− 2k)−m...

......

...−n−m −n+ (m− 2) . . . −n+ (m− 2l) . . . −n−m

In particolare, n+m e il peso piu alto di V (n)⊗V (m) e percio la rappresentazione irriducibileV (n + m) e una sottorappresentazione di V (n)⊗ V (m), con moltiplicita uno. Poiche i pesi diV (n+m) sono gli n+m− 2r, r = 0, . . . , n+m, gli altri pesi di V (n)⊗ V (m) sono quelli cherimangono togliendo la prima riga e l’ultima colonna della tabella. Il peso piu alto rimasto eallora (n−2)+m = n+m−2 e quindi V (n+m−2) e una sottorappresentazione di V (n)⊗V (m),con moltiplicita uno. Poi togliamo la prima riga e l’ultima colonna della tabella che era rimastae troviamo che V (n + m − 4) e una sottorappresentazione di V (n) ⊗ V (m), con moltiplicitauno, ecc. Conclusione:

V (n)⊗ V (m) ∼= V (n+m)⊕ V (n+m− 2)⊕ . . .⊕ V (|n−m|),

questa formula si chiama formula di Clebsch-Gordan.

5.6.3 Esempio. La formula di Clebsch-Gordan da:

V (1)⊗ V (1) ∼= V (2)⊕ V (0) ∼= Sym2(R2)⊕ R

dove la rappresentazione di sl(2) su R e quella banale. Questa si verifica facilmente, larappresentazione V (1) ⊗ V (1) e ottenuta dalla rappresentazione di SL(2) su M2(R) perr(g)(M) = gM tg (vedi 5.3.2), ovviamente Sym2(R2) e Alt2(R2) sono sottospazi invarianti,e abbiamo visto in 5.3.5 che Sym2(R2) ∼= V (2) e Alt2(R2) ha dimensione uno, quindi e larappresentazione banale dell’algebra di Lie semplice sl(2) (vedi 5.4.4).

Page 102: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

5 GRUPPI E ALGEBRE DI LIE 102

5.6.4 La decomposizione di prodotti tensoriali. Un modo comodo per trovare esplicita-mente la decomposizione di un prodotto tensoriale di rappresentazioni irriducibili di sl(2) datodalla formula di Clebsch-Gordan e il seguente.

Consideriamo V (n) = R[x, y]n e V (m) = R[u, v]m (vedi 5.3.5), prendiamo altre variabili perottenere la decomposizione di

V (n)⊗ V (m) = R[x, y]n ⊗ R[u, v]m

in modo piu semplice. Da 5.3.1 e 5.3.5 otteniamo:

ρn(X)⊗ ρm(X) = x∂y + u∂v, ρn(H)⊗ ρm(H) = x∂x − y∂y + u∂u − v∂v.

Con questi operatori si ottiene:

(ρn(X)⊗ ρm(X))(xv − yu) = (x∂y + u∂v)(xv − yu) = 0,

(ρn(H)⊗ ρm(H))(xv − yu) = (x∂x − y∂y + u∂u − v∂v)(xv − yu) = 0.

Quindi anche (xv − yu)k 7→ 0 applicando questi operatori.Per ottenere la decomposizione di una rappresentazione di sl(2) dobbiamo trovare i vettori

massimali, cioe i polinomi f ∈ R[x, y]n ⊗ R[u, v]m tali che (ρn(X) ⊗ ρm(X))(f) = 0 e tali che(ρn(H)⊗ ρm(H))(f) = kf , allora k ≥ 0 e f genera una coppia di V (k).

Poiche gli operatori lineari considerati sono derivazioni, troviamo:

(ρn(X)⊗ ρm(X))(xaub(xv − yu)c) = ub(xv − yu)c(ρn(X)⊗ ρm(X))(xa) + . . .

= axa−1ub(xv − yu)c(x∂y + u∂v)(x) + . . .

= 0 + 0 + 0 = 0,

e, similmente,

(ρn(H)⊗ ρm(H))(xaub(xv − yu)c) = (a+ b+ 0)xaub(xv − yu)c = (a+ b)xaub(xv − yu)c.

Quindi xaub(xv − yu)c e un vettore massimale, di peso a + b, per ogni a, b, c ∈ Z≥0 tale chexaub(xv − yu)c ∈ R[x, y]n ⊗ R[u, v]m, cioe tale che a + c = n, b + c = m. Supponiamo ora chen ≥ m, allora c = 0, 1, . . . ,m poi b = m − c, a = n − c e il peso massimale corrispondente ea+ b = n+m− 2c. Quindi troviamo che R[x, y]n⊗R[u, v]m ha sottorappresentazioni isomorfea V (n + m), V (n + m − 2), . . . , V (n − m). Secondo Clebsch e Gordan queste sono tutte lesottorappresentazioni irriducibili di R[x, y]n ⊗ R[u, v]m.

Nel caso n = m, lo scambio di variabili x↔ u, y ↔ v da una decomposizione in autospazi:

V (n)⊗ V (n) = Sym2(V (n)) ⊕ Alt2(V (n)).

Si noti che il vettore massimale della sottorappresentazione V (n − 2k) di V (n) ⊗ V (n) exn−kun−k(xv − yu)k, che e simmetrico se k e pari ed alternante se k e dispari. Quindi siha:

Sym2(V (n)) = V (2n)⊕ V (2n− 4)⊕ . . .⊕ V (2n− 4k) . . . ,

Alt2(V (n)) = V (2n− 2)⊕ V (2n− 6)⊕ . . .⊕ V (2n− 4k − 2) . . . .

Page 103: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 103

6 Le rappresentazioni dell’algebra di Lie sl(3)

Testi consigliati: [FH], [Ha], [Hu].

6.1 L’algebra di Lie sl(3).

6.1.1 Introduzione. In questo capitolo daremo la classificazione delle rappresentazioniirriducibili delle algebre di Lie sl(3) e su(3).

Il risultato e che le rappresentazioni irriducibili di sl(3) sono classificate da una coppia diinteri positivi, o meglio, da ‘un peso dominante’. In 6.5.9 mostriamo che c’e una biiezione tra lerappresentazioni irriducibili di sl(3) e quelle di su(3). Quest’ultime sono di grande importanzaper il modello standard delle particelle elementari, si veda il capitolo 14.

6.1.2 L’algebra di Lie sl(3). L’algebra di Lie sl(3) del gruppo di Lie SL(3) e data da:

sl(3) = X ∈M3(C) : Tr(X) := X11 +X22 +X33 = 0

(vedi 5.1.7), in particolare, sl(3) e uno spazio vettoriale complesso di dim sl(n) = 32 − 1 = 8.Sia h il sottospazio di sl(3) delle matrici diagonali:

h = H = diag(t1, t2, t3) ∈M3(C) : t1 + t2 + t3 = 0 ,

si noti che dim h = 2. Se H1, H2 ∈ h, allora H1H2 = H2H1 perche H1, H2 sono matrici diagonali,quindi si ha [H1, H2] = 0. Percio h e una sottoalgebra abeliana di sl(3).

Ogni H ∈ h definisce una mappa lineare

ad(H) : sl(3) −→ sl(3), X 7−→ ad(H)(X) := [H,X] (= HX −XH).

Un X ∈ sl(3) e un autovettore, con autovalore λ ∈ C, di ad(H) se ad(H)(X) = λX. Datoche ad(H)(H1) = 0 per ogni H1 ∈ h, ogni elemento nel sottospazio h e un autovettore di ad(H)con autovalore λ = 0, e questo per ogni H ∈ h.

Per trovare gli altri autovettori di ad(H) calcoliamo in modo esplicito questa mappa:

HX =

t1 0 00 t2 00 0 t3

x11 x12 x13

x21 x22 x23

x31 x32 x33

=

t1x11 t1x12 t1x13

t2x21 t2x22 t2x23

t3x31 t3x32 t3x33

,

e similmente

XH =

x11 x12 x13

x21 x22 x23

x31 x32 x33

t1 0 00 t2 00 0 t3

=

t1x11 t2x12 t3x13

t1x21 t2x22 t3x23

t1x31 t2x32 t3x33

.

Page 104: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 104

Quindi si ha

ad(H)(X) = [H,X] = HX −XH =

0 (t1 − t2)x12 (t1 − t3)x13

(t2 − t1)x21 0 (t2 − t3)x23

(t3 − t1)x31 (t3 − t2)x32 0

. (1)

Si noti che una matrice X = (xij) che ha tutti i coefficienti xij = 0, tranne x12 6= 0, e unautovettore con autovalore t1 − t2. Similmente per le altre coppie i, j con i 6= j.

Quindi conviene introdurre una base di sl(3) di ‘matrici elementari’. Sia Ei,j la matrice‘elementare’:

Ei,j ∈Mn(C), (Ei,j)kl = δikδjl

dove δab e la delta di Kronecker: δab = 1 se a = b e zero altrimenti. In particolare, tutti icoefficienti di Ei,j sono zero tranne il coefficiente nella i-esima riga e j-esima colonna che e(Ei,j)ij = 1. Per esempio

E1,1 =

1 0 00 0 00 0 0

, E1,2 =

0 1 00 0 00 0 0

, E2,1 =

0 0 01 0 00 0 0

.

La matrice Ei,i 6∈ sl(3) (perche Tr(Ei,i) = 1 6= 0), ma per esempio le due matrici H12, H23

definite daH12 := E1,1 − E2,2, H23 := E2,2 − E3,3

sono in sl(3) ed insieme sono una base di h. Una base di sl(3) e allora data da H12, H23 e le seimatrici Ei,j con 1 ≤ i, j ≤ 3 e i 6= j.

Il calcolo esplicito di ad(H)(X) (vedi equazione 1) mostra allora che ognuno di questi 8vettori di base di sl(3) e un autovettore di ad(H) e l’autovalore di Ei,j e ti − tj:

ad(H)(Ei,j) = [H,Ei,j] = (ti − tj)Ei,j.

In particolare, sulla base H12, H23, E1,2, E2,3, E1,3, E2,1, E3,2, E3,1 di sl(3) la matrice di ad(H) edata da una matrice 8× 8 diagonale:

ad(H) = diag(0, 0, t1 − t2, t2 − t3, t1 − t3, t2 − t1, t3 − t2, t3 − t1), H = diag(t1, t2, t3). (2)

6.1.3 L’algebra di Cartan h. Ogni matrice H ∈ h e diagonale. Secondo un teorema (vedi5.4.5), in ogni rappresentazione ρ di sl(3), la matrice ρ(H) puo allora essere diagonalizzata perogni H ∈ h.

L’algebra h e abeliana. Se X ∈ sl(3) e X 6∈ h, allora almeno un coefficiente xij di X con i 6= je non-zero. Questo implica, usando l’equazione (1), che [H,X] 6= 0 se H = diag(t1, t2, t3) ∈ h

e ti 6= tj. Quindi non esiste una sottoalgebra h′ ⊂ sl(3), piu grande di h (cioe h ⊂ h′) tale cheh′ sia abeliana. In generale una tale algebra e detta algebra di Cartan:

6.1.4 Definizione. Sia g un’algebra di Lie complessa semplice. Una sottoalgebra di Lie h ⊂ g

e detta un’algebra di Cartan se h e abeliana, se ogni elemento di h e diagonalizzabile (in una

Page 105: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 105

e quindi in ogni rappresentazione di g, vedi 5.4.5) e se h e massimale rispetto a tale proprieta(vedi [FH], Definition D.2).

Si puo mostrare che se h, h′ sono due algebre di Cartan di g, allora esiste un automorfismog→ g′ che manda h in h′, quindi h e essenzialmente unica (vedi [FH] D.3).

Il rango l di g e la dimensione di un’algebra di Cartan di g:

l = rango(g) := dimC h.

In particolare, il rango di sl(3) e l = 2.

6.1.5 I pesi delle rappresentazioni di sl(3). Sia h l’algebra di Cartan di sl(3) come in6.1.2, sia V uno spazio vettoriale complesso e sia

ρ : g −→ End(V )

una rappresentazione di g.Poiche ρ(H) e diagonalizzabile per ogni H ∈ h, si puo decomporre V in autospazi per

ρ(H12). Sia Vλ ⊂ V l’autospazio di ρ(H12) con autovalore λ. La mappa lineare ρ(H23) induceuna mappa lineare Vλ → Vλ, cioe ρ(H23)Vλ ⊂ Vλ, perche:

ρ(H12)(ρ(H23)v) = ρ(H23)(ρ(H12)v) = ρ(H23)(λv) = λ(ρ(H23)v), (v ∈ Vλ).

Poiche anche ρ(H23) e diagonalizzabile, il sottospazio Vλ ammette una decomposizione inautospazi per H23. Per λ, µ ∈ C definiamo un sottospazio Vλ,µ di Vλ (e quindi di V ) tramite

Vλ,µ = v ∈ V, : ρ(H12)v = λv, ρ(H23)v = µv ,

cioe il sottospazio di V di autovettori di ρ(H12) con autovalore λ e di autovettori di ρ(H23) conautovalore µ. Allora Vλ = ⊕µVλ,µ e V = ⊕(λ,µ)Vλ,µ.

Adesso consideriamo gli autovalori di ρ(H) per un elemento generico H ∈ h. Tale H ∈ h siscrive, in modo unico, come H = aH12 + bH23 per certi a, b ∈ C. Poiche ρ e lineare si ha perv ∈ Vλ,µ:

ρ(H)v =(aρ(H12) + bρ(H23)

)v = (aλ+ bµ)v (v ∈ Vλ,µ).

Quindi ρ(H) ha l’autovalore aλ + bµ su Vλ,µ, si noti che l’autovalore dipende in modo linearedagli elementi di H. Un autospazio Vλ,µ definisce allora una mappa lineare (un ‘peso’)

L : h −→ C, H = aH12 + bH23 7−→ aλ+ bµ, tale che ρ(H)v = L(H)v

per ogni v ∈ Vλ,µ. Si scrive VL := Vλ,µ e VL e detto uno spazio peso (invece di autospazio pertutti gli elementi di h) con peso L ∈ h∗, lo spazio duale di h.

In particolare, ogni rappresentazione V ammette una decomposizione in spazi peso:

V = ⊕L∈h∗VL, ρ(H)v = L(H)v (∀v ∈ VL).

Poiche dimV e finita, VL = 0 tranne che per un numero finito di L ∈ h∗, questi L sono detti ipesi della rappresentazione ρ. La molteplicita di un peso L e per definizione la dimensione diVL.

Page 106: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 106

6.1.6 La rappresentazione aggiunta di sl(3). La rappresentazione aggiunta dell’algebradi Lie sl(3) e (vedi 5.2.5 e 6.1.2):

ad : g −→ End(g), X 7−→ (ad(X) : Y 7→ [X, Y ]).

Abbiamo visto che rispetto a una base opportuna di sl(3) si ha (vedi equazione 2 di 6.1.2):

ad(diag(t1, t2, t3)) = diag(0, 0, t1 − t2, t2 − t3, t1 − t3, t2 − t1, t3 − t2, t3 − t1).

Definiamo Li ∈ h∗ con:

Li : h −→ C, Li(diag(t1, t2, t3)) = ti.

Poiche∑ti = 0 gli Li ∈ h∗ non sono indipendenti in h∗ ma si ha:

L1 + L2 + L3 = 0 ∈ h∗,

In particolare, Li e Li− c(L1 +L2 +L3) sono la stessa mappa lineare su h per ogni c ∈ C. Unabase dello spazio due dimensionale h∗ e L1 − L2, L2 − L3.

Visto che (Li−Lj)(H) = ti− tj otteniamo allora che i pesi della rappresentazione aggiuntadi sl(3) sono L = 0 e

α1 := L1 − L2, α2 := L2 − L3, L1 − L3, L2 − L1, L3 − L2, L3 − L1,

questi sei pesi hanno molteplicita uno, il peso 0 ha molteplicita 2. In particolare, l’algebra diLie sl(3) ha la decomposizione in spazi peso:

sl(3) = h ⊕ (⊕α∈h∗−0 gα)

dove il sottospazio gα e definito da:

gα := X ∈ sl(3) : [H,X] = α(H)X ,

se α = Li − Lj allora gα = CEi,j, in particolare ogni gα e uno dimensionale.

6.1.7 Le radici di sl(3). Un elemento α ∈ h∗ e detto una radice (inglese: root) di g = sl(3)se α 6= 0 e gα 6= 0. L’insieme delle radici e indicato con R, quindi R = ±(Li − Lj) : i 6= j.

Lo spazio radice (inglese root space) e l’autospazio gα di g, dove α ∈ R.Una radice α = Li − Lj e detta positiva se i < j, l’insieme delle tre radici positive lo si

indica con R+.Per una radice α = Li − Lj positiva si definisce

Hα := Ei,i − Ej,j, Xα := Ei,j, X−α := Ej,i,

si noti che Hα ∈ h, Xα ∈ gα e X−α ∈ g−α. Nel caso α = L1 − L2 si ha H12 = Hα ecc. Ilsottospazio tridimensionale di g generato da Hα, Xα, X−α e una sottoalgebra di Lie di g isomorfaa sl(2), infatti si verifica che:

[Hα, Xα] = 2Xα, [Hα, X−α] = −2X−α, [Xα, X−α] = Hα,

Page 107: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 107

che coincide con i commutatori di sl(2) (vedi 5.4.2).

6.1.8 Il sistema delle radici di sl(3). Per visualizzare le radici di sl(3), che sono vettoriin h∗ ∼= C2, conviene anzitutto osservare che le sei radici generano un sottospazio reale didimensione due, indicato con h∗R,

h∗R := Rα⊕ Rα2, α := L1 − L2, α2 := L2 − L3.

Come abbiamo visto in 6.1.6 le mappe lineari∑

i aiLi e∑

i aiLi−c(L1 +L2 +L3) sono uguali suh∗. Conviene normalizzare il modo di scrivere un peso nel modo seguente: la normalizzazionedi∑

i aiLi e∑

i aiLi − c(L1 +L2 +L3) con c = (a1 + a2 + a3)/3; con questa normalizzazione siha∑i

biLi :=∑i

aiLi − 13(∑i

ai)(L1 + L2 + L3), con b1 + b2 + b3 = (∑i

ai)− 313(∑i

ai) = 0.

Usando questa normalizzazione, si puo definire un prodotto scalare (−,−) su h∗R nel modoseguente:

(∑

aiLi,∑

biLi) = a1b1 + a2b2 + a3b3, (∑

ai =∑

bi = 0).

E’ importante la normalizzazione∑ai =

∑bi = 0, per esempio, senza questa, (L1, L1) = 1

mentre in realta:

(L1, L1) = ((2L1 − L2 − L3)/3, (2L1 − L2 − L3)/3) = (4 + 1 + 1)/9 = 2/3.

Le radici α1 = L1 − L2, α2 = L2 − L3 sono gia normalizzate e si ha

(α1, α1) = (α2, α2) = 2, (α1, α2) = −1.

In 6.6 si da un modo meno ad-hoc per costruire il prodotto scalare su h∗.Un disegno del sistema di radici e allora:

-

-

-

α1

α2 α1 + α2 α1 = L1 − L2,α2 = L2 − L3,

α1 + α2 = L1 − L3.

6.1.9 Il gruppo di Weyl. Per una radice α, denotiamo con α⊥ l’iperpiano perpendicolaread α:

α⊥ := x ∈ h∗R : (x, α) = 0 (⊂ h∗R).

Page 108: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 108

Sia sα la riflessione in α⊥:

sα : h∗R −→ h∗R, x 7−→ x− 2(x, α)

(α, α)α = x− (x, α)α,

(l’ultima ugualianza vale perche (α, α) = 2 per ogni radice di sl(3)), per verificare la formulabasta notare la linearita, che sα(x) = x se x ∈ α⊥, cioe se (x, α) = 0, e che sα(λα) = −λα perα ∈ R. Si noti che sα = s−α per ogni α.

Il sottogruppo del gruppo ortogonale di h∗R generato dalle sα, α ∈ R e il gruppo di Weyl dig, denotato

W = W (g) := 〈 sα : α ∈ R 〉 (⊂ O(h∗R)).

Dal diagramma in 6.1.8 si vede (e si verifca facilmente) che, con α1 = L1−L2, α2 = L2−L3,si ha

sα1 :

α1 7−→ −α1,α2 7−→ α1 + α2,

sα2 :

α1 7−→ α1 + α2,α2 7−→ −α2,

sα1+α2 :

α1 7−→ −α2,α2 7−→ −α1.

L’insieme delle sei radici R rimane quindi invariante sotto W . Si noti che sα1 permuta L1, L2

e fissa L3, sα2 permuta L2, L3 e fissa L1 mentre sα1+α2 permuta L1, L3 e fissa L2, per esempio

sα1+α2(α1) = sα1+α2(L1 − L2) = L3 − L2 = −(L2 − L3) = −α2.

E’ facile vedere che il gruppo di Weyl di sl(3) e isomorfo al gruppo simmetrico S3 per esempioperche permuta le Li.

6.1.10 Pesi e prodotto scalare. Sia α = Li − Lj ∈ R+ e sia Hα = Ei,i − Ej,j l’elementodi h nella copia di sl(2) definito da α (vedi 6.1.7). Sia λ =

∑aiLi ∈ h∗, normalizzata, cioe∑

ai = 0. Allora

λ(Hα) = (∑

aiLi)(Ei,i − Ej,j) = ai − aj.

D’altra parte, poiche λ e Li − Lj sono normalizzati, anche:

(λ, α) = (∑

aiLi, Li − Lj) = ai − aj.

Quindi otteniamo l’identita, per ogni λ ∈ h∗ e ogni α ∈ R:

λ(Hα) = (λ, α). (3)

6.1.11 Commutatori e radici in sl(3). Mostriamo che le radici determinano varicommutatori:

[gα, gβ] ⊆ gα+β (α, β ∈ R),

in particolare [gα, gβ] = 0 se α+β 6∈ R. La dimostrazione e facile, sia Xα ∈ gα, Xβ ∈ gβ, allora

[H, [Xα, Xβ]] = [[H,Xα], Xβ] + [Xα, [H,Xβ]]

= α(H)[Xα, Xβ] + β(H)[Xα, Xβ]

= (α + β)(H)[Xα, Xβ]

Page 109: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 109

e percio [Xα, Xβ] ∈ gα+β, dove abbiamo usato l’identita di Jacobi come in 5.2.5. Si puo mostrareche [gα, gβ] = gα+β se α + β ∈ R.

6.2 Pesi: integralita e simmetria

6.2.1 I pesi di una rappresentazione. In 6.1.5 abbiamo visto che ogni rappresentazione

ρ : sl(3) −→ End(V )

da una decomposizione di V in spazi peso (autospazi per gli elementi dell’algebra di Cartan h):

V = ⊕λ Vλ, ρ(H)v = λ(H)v (∀H ∈ h, v ∈ Vλ)

dove λ : h → C e un’applicazione lineare. L’insieme delle λ ∈ h∗ per le quali Vλ 6= 0 e dettol’insieme dei pesi di ρ.

Per esempio, i pesi della rappresentazione aggiunta di g sono le radici e λ = 0 (vedi 7.1.5)

sl(3) = h⊕ (⊕α∈Rgα).

Un altro esempio e V = C3, la rappresentazione standard di g = sl(3). Poiche H =diag(t1, t2, t3) ∈ h e gia diagonale sulla base standard ei di V , si ha:

V = C3 = VL1 ⊕ VL2 ⊕ VL3 , VLi = Cei, perche Hei = tiei = Li(H)ei.

6.2.2 Integralita e reticolo dei pesi ΛW . L’algebra di Cartan h e generata su C daH12 = Hα1 e H23 = Hα2 .

Dato un Hα, ci sono X±α ∈ g tali che < Hα, Xα, X−α > sia una sottoalgebra di Lie dig isomorfa a sl(2) e tale che [Hα, X±α] = ±2X±α (vedi 6.1.7). In particolare, la restrizionedella rappresentazione ρ a questa sl(2) e una rappresentazione di sl(2) e quindi gli autovaloridi ρ(Hα) su V sono interi (vedi 5.5.8).

Percio, per ogni peso λ di V e per ogni α ∈ R si ha:

λ(Hα) ∈ Z

Questo e equivalente a (vedi 6.1.10):

(λ, α) ∈ Z (∀α ∈ R).

Quindi un peso di una rappresentazione di sl(3) e contenuto nell’insieme:

ΛW := λ ∈ h∗R : (λ, α) ∈ Z ∀α ∈ R .

Ognuna delle sei radici ±α1,±α2,±(α1 +α2) di sl(3) si scrive come aα1 + bα2, con a, b ∈ Z.Quindi (λ, γ) ∈ Z per ogni γ ∈ R se e solo se (λ, αi) ∈ Z per i = 1, 2.

Page 110: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 110

I pesi fondamentali di sl(3) sono gli elementi λ1, λ2 ∈ h∗R definiti da(λ1, α1) = 1,(λ1, α2) = 0,

(λ2, α1) = 0,(λ2, α2) = 1,

,

dove α1 = L1−L2, α2 = L2−L3 e la base ‘standard’ di h∗. Poiche (−,−) e un prodotto scalaresu h∗R segue che anche λ1, λ2 e una base di h∗R e per definizione λ1, λ2 ∈ ΛW .

In piu, si ha

(∑

aiλi, α1) ∈ Z ⇐⇒ a1 ∈ Z, (∑

aiλi, α2) ∈ Z ⇐⇒ a2 ∈ Z.

Quindi otteniamo che:ΛW = Zλ1 ⊕ Zλ2.

L’insieme ΛW e quindi un sottogruppo abeliano di rango 2 di h∗R e genera questo spazio. Essosi chiama il reticolo dei pesi (weight lattice) di sl(3).

Un semplice calcolo mostra che

λ1 = L1 = (2L1 − L2 − L3)/3 λ2 = L1 + L2 = (L1 + L2 − 2L3)/3.

cccccccc

ccc

cccccc

ccc

ccccc

cccc

ccccc

cccc

cccc

ccccc

cccc

ccccccc

cccccccc

cc

cccccc

cc

cccccc

ccc

ccccc

ccc

s sα1s s

sα2

s

s

s

λ1

λ2

0

Pesi fondamentali e radici di sl(3)

Page 111: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 111

6.2.3 Il reticolo delle radici di sl(3). Il reticolo delle radici di sl(3) e il gruppo:

ΛR := Zα1 + Zα2 α1 = L1 − L2, α2 = L2 − L3.

Poiche ogni radice e una combinazione lineare con coefficienti interi delle radici semplici α1, α2,si ha R ⊂ ΛR. Inoltre, ogni radice e un peso della rappresentazione aggiunta e quindi ΛR ⊂ ΛW .In modo esplicito:

α1 = L1 − L2 = 2λ1 − λ2, α2 = L2 − L3 = −λ1 + 2λ2.

Il gruppo quoziente ΛW/ΛR risulta essere un gruppo finito con tre elementi e ha (piu pre-cisamente, il suo ‘duale’) un’interpretazione in termini del gruppo di Lie SL(3,C), vedi [FH]p.372-374.

6.2.4 Radici e pesi. L’algebra di Lie sl(3) ammette la decomposizione in spazi peso per larappresentazione aggiunta:

sl(3) = h⊕ (⊕α∈R gα).

Mostriamo che l’azione di un ρ(Xα), con Xα ∈ gα, manda Vλ in Vλ+α,

ρ(Xα) : Vλ −→ Vλ+α (Xα ∈ gα).

Per verificare cio, sia v ∈ Vλ:

ρ(H)(ρ(Xα)v) = (ρ([H,Xα]) + ρ(Xα)ρ(H))v= (ρ(α(H)Xα) + ρ(Xα)ρ(H))v= (α(H) + λ(H))(ρ(Xα)v)= (λ+ α)(H)(ρ(Xα)v),

quindi ρ(Xα)v ∈ Vλ+α.

6.2.5 Il gruppo di Weyl e i pesi. Mostriamo che per α ∈ R+ e λ un peso di V , anchesα(λ) e un peso di V , cioe l’insieme dei pesi di una rappresentazione e invariante per l’azionedel gruppo di Weyl su h∗R. In piu dimVλ = dimVsα(λ), cioe, i pesi nella stessa orbita del gruppodi Weyl hanno la stessa molteplicita.

Anzitutto si ha:sα(λ) = λ− (λ, α)α = λ− λ(Hα)α.

Consideriamo la restrizione di ρ : sl(3)→ End(V ) a sl(2) :=< Hα, Xα, X−α > (vedi 6.1.7).Visto che ρ(Hα)v = λ(Hα)v per ogni v ∈ Vλ, lo spazio Vλ e uno spazio peso per sl(2) con pesok := λ(Hα) e molteplicita dimVλ. Come visto in 6.2.4, ρ(X±α)Vλ ⊂ Vλ±α. Quindi otteniamouna rappresentazione di sl(2) sul sottospazio V[λ] di V definita da:

V[λ] := ⊕n∈Z Vλ+nα (⊂ V ).

Il sottospazio Vλ+nα e uno spazio peso per Hα ∈ sl(2) con peso (λ + nα)(Hα) = λ(Hα) + 2nperche α(Hα) = (α, α) = 2.

Page 112: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 112

Dalla teoria delle rappresentazioni di sl(2) segue che se k e un peso di una rappresentazionedi sl(2), allora anche −k e un peso con la stessa molteplicita e che ρ(X±α)k e un isomorfismotra questi due spazi pesi (con segno − se k > 0). Per k > 0 si ha allora ρ(X−α)k(Vλ) = Vλ−kαe k = λ(Hα), e percio:

ρ(X−α)k : Vλ∼=−→ Vλ−λ(Hα)α = Vsα(λ).

Quindi anche Vsα(λ) e uno spazio peso e dimVsα(λ) = dimVλ.

6.3 Il peso massimale di una rappresentazione irriducibile

6.3.1 La camera di Weyl. Poiche il gruppo di Weyl W permuta i pesi di ogni rappresen-tazione di g, e interessante avere un modo di determinare un unico elemento (almeno, quasisempre) in ogni orbita di W , dove l’orbita di un peso λ sotto W e l’insieme delle w(λ) dove wpercorre W . Visto che W ∼= S3 permuta le Li, l’orbita di λ1 = (2L1 − L2 − L3)/3 e

(2L1 − L2 − L3)/3 = λ1, (−L1 + 2L2 − L3)/3 = −λ1 + λ2, (−L1 − L2 + 2L3)/3 = −λ2

(si noti che sα2 fissa λ1), mentre l’orbita di α1 = L1 − L2 e R, l’insieme delle radici.La camera di Weyl fondamentale (chiusa) e il sottoinsieme di h∗R dato da:

C = x ∈ h∗R : (x, αi) ≥ 0, i = 1, 2 = a1L1 + a2L2 + a3L3 : a1 ≥ a2 ≥ a3 .

Nel diagramma in 6.2.2, i bordi di C, detti pareti della camera di Weyl fondamentale, sono ledue semirette indicate; la parte triangolare che essi definiscono e C.

Poiche W permuta gli Li e facile vedere che per ogni x ∈ h∗R esiste un w ∈ W tale chew(x) ∈ C. Questo w e unico tranne se w(x) e su una delle due pareti di C, nel qual caso lariflessione in quella parete fissa w(x) (vedi [FH], Lemma D.31).

6.3.2 I pesi dominanti. Un peso λ ∈ ΛW e detto dominante se λ ∈ ΛW ∩ C. L’insieme deipesi dominanti e indicato con

Λ+W := ΛW ∩ C =

∑miλi : mi ∈ Z≥0

,

l’ultima ugualianza segue dal fatto che (∑miλi, αj) = mj.

6.3.3 Vettori massimali e pesi massimali. Sia ρ : sl(3)→ End(V ) una rappresentazionedi sl(3). Un peso λ di ρ e detto massimale se esiste v ∈ Vλ, v 6= 0, tale che ρ(Xα)v = 0 perogni α ∈ R+. Il vettore v ∈ Vλ e detto vettore massimale di ρ.

Cio generalizza il concetto di vettore massimale per una rappresentazione di sl(2), vedi 5.5.5.Nel caso g = sl(2) i pesi massimali (in quel caso, interi n ∈ Z≥0) classificano le rappresentazioniirriducibili di g (vedi 5.5.10).

Visto che R+ = α1, α2, α1 + α2 e Xα1+α2 = [Xα1 , Xα2 ], si ha:

ρ(Xα1+α2) = ρ(Xα1)ρ(Xα2)− ρ(Xα2)ρ(Xα1),

Page 113: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 113

quindi un vettore v ∈ Vλ e massimale se e solo se ρ(Xαi)v = 0 per i = 1, 2.Se λ e un peso tale che Vλ+α1 = Vλ+α2 = 0, allora, poiche ρ(Xα)(Vλ) ⊂ Vλ+α, ogni v ∈ Vλ,

v 6= 0, e un vettore massimale di ρ.

6.3.4 I pesi massimali sono dominanti. Mostriamo che un peso massimale e un pesodominante. Sia λ un peso massimale e sia v ∈ Vλ un vettore massimale. Sia 〈Hα, X±α〉 ⊂ sl(3)la copia di sl(2) definita da α, allora il vettore massimale v ∈ Vλ e un vettore massimale perquesta sl(2). Percio ρ(Hα)v = λ(Hα)v con λ(Hα) ≥ 0. Per le radici α1, α2 ∈ R+ si ha allora0 ≤ λ(Hαi) = (λ, αi), quindi λ e dominante.

6.3.5 Esistenza di un vettore massimale. L’insieme dei pesi di una rappresentazione ρ disl(3) e un insieme finito, quindi esiste un peso λ tale che Vλ 6= 0 ma Vλ+α = 0 per ogni α ∈ R+.

Quindi λ e un peso massimale di ρ e ogni v ∈ Vλ, v 6= 0 e un vettore massimale di ρ.

6.3.6 Esempio. Consideriamo la rappresentazione aggiunta V = sl(3) di sl(3). I suoi pesisono lo 0 e gli Li−Lj con i 6= j. Tra questi, i pesi dominanti sono 0 e L1−L3 = α1+α2 = λ1+λ2.Quindi se v ∈ V e un vettore massimale, si ha v ∈ V0 = h oppure v ∈ VL1−L3 = CE1,3.

Un vettore v ∈ V0 si scrive come v = aH12 + bH23 = aHα1 + bHα2 per certi a, b ∈ C. Poi ve massimale sse ρ(Xαi)v = 0 per i = 1, 2. Si ricordi che [Hα, Xβ] = β(Hα)Xβ = (β, α)Xβ, cosı

ρ(Xα1)v = [Xα1 , aHα1 + bHα2 ] =(−aα1(Hα1)− bα1(Hα2)

)Xα1 = (−2a+ b)Xα1 ,

quindi se v e massimale si ha b = 2a. In modo simile, ρ(Xα2)v = (a − 2b)Xα2 , quindi se v emassimale anche a − 2b = 0 cioe a − 4a = 0 e percio a = b = 0. La conclusione e che non cisono vettori massimali in V0.

In 6.3.5 abbiamo visto che V dovrebbe avere un vettore massimale, e quindi ci deve essereun vettore massimale in VL1−L3 . Poiche dimVL1−L3 = 1, ogni vettore non-zero in VL1−L3 emassimale. Si noti anche che VL1−L3 = Vα1+α2 e che α1 + α2 + αi non e un peso di V peri = 1, 2; questo implica che ogni vettore in Vα1+α2 e massimale.

6.3.7 La rappresentazione irriducibile generata da un vettore massimale. Sia v ∈ Vλun vettore massimale. Sia W il sottospazio generato dalle immagini di v mediante successiveapplicazioni di elementi di gβ con β ∈ R−.

Mostriamo che W e una sottorappresentazione di g := sl(3). Sia R− = β1 = L2−L1, β2 =L3 − L2, β3 = L3 − L1,

Wn := 〈 ρ(Xβi1) . . . ρ(Xβik

)v : βij ∈ R−, 0 ≤ k ≤ n 〉, W = ∪∞n=0Wn.

Poiche ρ : g → End(V ) e lineare, basta mostrare che ρ(X)x ∈ W per ogni x ∈ W e X =H,Xβ, Xα con H ∈ h, β ∈ R− e α ∈ R+.

Sia x = ρ(Xβi1) . . . ρ(Xβik

)v ∈ Wn con k ≤ n. Allora ρ(H)x = µ(H)x con µ = λ + βi1 +. . .+ βik (vedi 8.1.6), quindi ρ(H)x ∈ W e, in piu, x ∈ Vµ. In particolare,

ρ(h)Wn ⊂ Wn (∀n ∈ Z≥0),

Page 114: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 114

e segue che ρ(H)W ⊂ W per ogni H ∈ h. L’unico vettore (a meno di moltiplicazione per unoscalare) in W con peso λ e v:

Wλ = Cv,

e ogni altro peso di W si scrive come µ = λ + βi1 + . . . + βik con k ≥ 1 e βij ∈ R−, cioeµ = λ− kα− lα2 con k, l ∈ Z≥0 dove α1 = L1 − L2, α2 = L2 − L3.

La definizione di Wn mostra che per x ∈ Wn e β ∈ R− si ha ρ(Xβ)x ∈ Wn+1. Segue cheρ(Xβ)W ⊂ W per ogni β ∈ R−.

Infine, mostriamo per induzione su n che

ρ(Xα)Wn ⊂ Wn ∀Xα ∈ gα, ∀α ∈ R+;

da cio segue che ρ(Xα)W ⊂ W per ogni α ∈ R+. Se n = 0, si ha W0 = Cv e ρ(Xα)v = 0 perchev e un vettore massimale. Se x ∈ Wn e n > 0, allora x = ρ(Xβ)y con y ∈ Wn−1 e β ∈ R−,quindi

ρ(Xα)x = ρ(Xα)ρ(Xβ)y= ρ(Xβ)ρ(Xα)y + ρ([Xα, Xβ])y.

Si noti che Y := [Xα, Xβ] ∈ gα+β. Se α + β 6∈ R ∪ 0, gα+β = 0 e quindi Y = 0. Seα + β = 0, Y ∈ h e quindi ρ(Y )y ∈ Wn. Se α + β ∈ R− allora ρ(Y )y ∈ Wn perche y ∈ Wn−1.Se α + β ∈ R+ si ha ρ(Y )y ∈ Wn−1 per l’ipotesi di induzione. Quindi in ogni caso si haρ([Xα, Xβ])y ∈ Wn. Sempre per l’ipotesi di induzione, per y ∈ Wn−1 si ha ρ(Xα)y ∈ Wn−1, epercio ρ(Xβ)ρ(Xα)y ∈ Wn. Allora anche ρ(Xβ)ρ(Xα)y+ ρ([Xα, Xβ])y ∈ Wn e concludiamo cheρ(Xα)x ∈ Wn.

6.3.8 La rappresentazione W e irriducibile. Mostriamo che la rappresentazione W dig generata dal vettore massimale v e irriducibile. Sia W = W ′ ⊕ W ′′, dove W ′,W ′′ sonosottorappresentazioni. Decomponendo ciascuna in spazi peso, lo spazio peso Wλ = Cv, che hadimensione uno, e contenuto in W ′ oppure W ′′. Poiche la rappresentazione di g generata da ve W si ha W ′ = W oppure W ′′ = W , quindi W e irriducibile.

6.3.9 Il vettore massimale e unico. Mostriamo che v e l’unico vettore massimale (a menodi moltiplicazione per uno scalare) nella rappresentazione W . Sia v′ ∈ W , v′(6= 0) un vettoremassimale. Allora v′ genera una sottorappresentazione W ′ ⊂ W . Dato che W e irriducibile eW ′ 6= 0, si ha allora W ′ = W . Sia µ ∈ ΛW il peso di v′, allora µ = λ − nα1 −mα2 per certin,m ∈ Z≥0 e α1 = L1 − L2, α2 = L2 − L3.

Ogni altro peso di W ′ si scrive come τ = µ−kα1− lα2 per certi k, l ∈ Z≥0. Dato che v ∈ W ′

e il peso di v e λ segue allora che λ = µ − kα1 − lα2 = λ − (k + n)α1 − (l + m)α2 e quindik + n = l + n = 0 ma poiche k, l,m, n ≥ 0 segue allora n = m = 0 e percio µ = λ. Dato cheWλ = Cv, segue v′ ∈ Cv. In particolare, una rappresentazione irriducibile ha un unico vettoremassimale, a meno di moltiplicazione per uno scalare.

6.3.10 Conclusione. Data una rappresentazione ρ : g → End(V ), il teorema di Weyl (vedi5.4.6) afferma che V = V1 ⊕ V2 ⊕ . . . ⊕ Vk, dove ogni Vi e una rappresentazione irriducibile.I risultati appena ottenuti mostrano che ogni Vi ha un vettore massimale vi e che il vettore

Page 115: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 115

massimale vi genera una sottorappresentazione irriducibile di Vi, che e quindi Vi. In particolare,la dimensione dello spazio generato dai vettori massimali e k.

Se la rappresentazione ρ e irriducibile, allora ha un unico vettore massimale (a meno dimoltiplicazione per uno scalare). Il peso λ = λρ del vettore massimale e allora determinatoin modo unico dalla rappresentazione. Questo peso λ e massimale (per definizione) e abbiamomostrato che e quindi dominante (si veda 6.3.4).

Nell’ esempio 6.3.6 abbiamo visto che la rappresentazione aggiunta ad ha un unico vettoremassimale, quindi ad e irriducibile. In piu si ha λad = λ1 + λ2.

Mostriamo che il peso λ determina in modo unico (a meno di isomorfismi) la rappresen-tazione irriducibile W generata dal vettore massimale. Questa rappresentazione irriducibileverra indicata con V (λ).

Poi c’e da stabilire se un peso dominante λ determini una rappresentazione irriducibile ilcui vettore massimale abbia peso λ (si veda 6.4.2).

6.3.11 Unicita della rappresentazione irriducibile. Due rappresentazioni irriducibiliρV , ρW di g su spazi vettoriali V,W rispettivamente, con vettori massimali v ∈ V e w ∈ W elo stesso peso λ ∈ Λ+

W sono isomorfe. Per vedere questo, si consideri la somma diretta V ⊕W ,che e una rappresentazione di g con

ρ : g −→ End(V ⊕W ), ρ(X)(x, y) := (ρV (X)x, ρW (X)y).

Sia U ⊂ V ⊕ W la sottorappresentazione generata da (v, w). Allora U e irriducibile perche(v, w) e un vettore massimale in V ⊕W . La proiezione

πV : U −→ V, (x, y) 7−→ x, soddisfa πV ρ(X) = ρV (X)πV

per ogni X ∈ g come si verifica facilmente. Quindi πV e un omomorfismo di rappresentazioni epercio ker(πV ) e im(πV ) sono sottospazi invarianti (vedi 5.3.3). Poiche (v, w) ∈ U e πV (v, w) =v ∈ V , si ha ker(πV ) 6= U e im(πV ) 6= 0. Dato che U e V sono irriducibili, si ha alloraker(πV ) = 0 e im(πV ) = V , quindi πV e un isomorfismo. Similmente, usando πW , si trova cheU ∼= W , quindi V ∼= W .

6.4 Le rappresentazioni irriducibili di sl(3)

6.4.1 Classificazione. In 6.3.10 abbiamo visto che una rappresentazione irriducibile

ρ : sl(3) −→ End(V )

ha un unico vettore massimale (a meno di moltiplicazione per uno scalare) vρ e che vρ sta inuno spazio peso Vλ di V . Il peso λ = λρ e allora l’unico peso massimale di V . In piu λ e sempreun peso dominante. In 6.3.11 abbiamo visto che il peso λ determina ρ in modo unico.

Mostriamo che viceversa ogni peso dominante λ definisce una rappresentazione irriducibiledi sl(3), denotata V (λ), tale che l’unico vettore massimale di V (λ) ha peso λ.

Page 116: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 116

Fatto questo, segue che le rappresentazioni irriducibili di sl(3) sono classificate dal loro pesomassimale e c’e una biiezione tra l’insieme dei pesi dominanti Λ+

W e l’insieme delle rappresen-tazioni irriducibili di sl(3) data da λ 7→ V (λ) con inversa ρ 7→ λρ, l’unico peso massimale diρ.

Λ+W = m1λ1 +m2λ2 : mi ∈ Z≥0

bi←→ rappr. irrid. di sl(3) , λ 7−→ V (λ).

6.4.2 Le rappresentazioni irriducibili fondamentali. Per costruire la rappresentazioneV (λ), con λ dominante, mostriamo prima che le rappresentazioni V (λ1) e V (λ2) sono larappresentazione standard di sl(3) e il suo duale. Le rappresentazioni V (λi) si chiamanorappresentazioni fondamentali di sl(3).

Si ricordi che i pesi della rappresentazione standard C3 di sl(3) sono L1, L2, L3 (vedi 6.1.5),e facile verificare che L1 e l’unico peso dominante di C3. Quindi L1 e l’unico peso massimalee poiche dimVL1 = 1 la rappresentazione C3 e irriducibile, con peso massimale L1. Visto cheL1 = (2L1 − L2 − L3)/3 = λ1 (vedi 6.2.2), C3 e allora la rappresentazione irriducibile checorrisponde al peso dominante λ1:

V (λ1) = C3.

Si ricordi che l’azione di A ∈ SL(3,C) sullo spazio duale e data dalla matrice tA−1 (vedi1.1.12). Per l’algebra di Lie questo implica (si usi un cammino γ(t) con γ(0) = I e γ′(0) = X)che l’azione di X ∈ sl(3) sullo spazio duale e data da −tX. In particolare, se H = diag(t1, t2, t3)allora rispetto alla base duale di V (λ1) = C3 l’azione di H e diag(−t1,−t2,−t3). Percio i pesidella rappresentazione duale V (λ1)∗ sono −L1,−L2,−L3. Si verifica che l’unico peso dominantedi V (λ1)∗ e il peso

−L3 = L1 + L2 = (L1 + L2 − 2L3)/3 = λ2, quindi V (λ2) = V (λ1)∗.

Per mostrare che una rappresentazione con peso massimale λ = m1λ1 + m2λ2 e mi ≥ 0esiste, consideriamo prodotti tensoriali di V (λ1) e V (λ2).

6.4.3 Prodotti tensoriali e pesi. Il prodotto tensoriale di rappresentazioni ρV , ρW diun’algebra di Lie g e definito da

ρV⊗W (X)(v ⊗ w) = (ρ(X)v)⊗ w + v ⊗ (ρW (X)w).

In particolare, se X = H ∈ g e

ρV (H)v = µ1(H)v, ρW (H)w = µ2(H)w =⇒ ρV⊗W (H)(v ⊗ w) = (µ1 + µ2)(H)(v ⊗ w).

Quindi se Vµ1 e Wµ2 sono spazi peso di V e W , il loro prodotto tensoriale e contenuto in unospazio peso di V ⊗W :

Vµ1 ⊗Wµ2 ⊂ (V ⊗W )µ1+µ2 .

In generale si ha Vµ1 ⊗ . . .⊗ Vµk ⊂ Vµ1+...+µk .

Page 117: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 117

6.4.4 Costruzione delle V (λ). Sia λ = m1λ1 + m2λ2, mi ∈ Z≥0 un peso dominante.Consideriamo il prodotto tensoriale

V := V (λ1)⊗ . . .⊗ V (λ1)︸ ︷︷ ︸m1

⊗V (λ2)⊗ . . .⊗ V (λ2)︸ ︷︷ ︸m2

=: V (λ1)⊗m1 ⊗ V (λ2)⊗m2 .

Sia vi ∈ V (λi) un vettore massimale e sia

v := v1 ⊗ . . .⊗ v1︸ ︷︷ ︸m1

⊗ v2 ⊗ . . .⊗ v2︸ ︷︷ ︸m2

(∈ V ).

Dato che vi ∈ V (λi) e un vettore massimale, cioe ρi(Xα)vi = 0 per ogni αi ∈ R+, si ha

ρ(Xα)v = ρ1(Xα)v1 ⊗ v1 . . .⊗ v2 + . . .+ v1 ⊗ v1 . . .⊗ ρ2(Xα)v2 = 0 + . . .+ 0 = 0.

Quindi v e un vettore massimale in V con peso (massimale e quindi dominante):

ρ(H)v = (m1λ1 +m2λ2)(H)v = λ(H)v.

Percio v genera una rappresentazione irriducibile W ⊂ V con (un unico) peso massimale λ (vedi6.3.7). Questa rappresentazione W e l’unica rappresentazione irriducibile con peso massimaleλ (vedi 6.3.11) ed e la rappresentazione indicata con V (λ), cioe V (λ) := W .

In questo modo si conclude la classificazione delle rappresentazioni irriducibili di sl(3). Peroper determinare la dimensione (vedi 8.2.14 per una formula esplicita) o per poter decomporrereprodotti tensoriali di rappresentazioni di sl(3) ci vuole uno studio piu approfondito, vedi 6.5.Il legame con le rappresentazioni di su(3) e dato in 6.5.9.

6.5 Le rappresentazioni irriducibili di sl(3)

6.5.1 Il prodotto simmetrico della rappresentazione standard. Mostriamo che larappresentazione V (kλ1) (per k ≥ 0) di sl(3) e la rappresentazione SkV (λ1), il k-esimo prodottosimmetrico della rappresentazione standard V = V (λ1). In piu determiniamo gli spazi peso emostriamo che ogni spazio peso ha dimensione 1.

Consideriamo (si veda anche 5.3.4 per il caso n = 2) la rappresentazione del gruppo di LieSL(3,R) su C∞(R3) definita da:

r : SL(3,R) −→ Aut(C∞(R3)), (r (A)F )(v) := F (tAv) (v ∈ R3).

Sia ρ := (dr)I : sl(3,R) → End(C∞(R3)) la rappresentazione dell’algebra di Lie associata. Simostra facilmente che, per i 6= j,

ρ(Ei,j) = xi∂

∂xj, ρ(t1E1,1 + t2E2,2 + t3E3,3) = t1x1

∂x1

+ t2x2∂

∂x2

+ t3x3∂

∂x3

.

Page 118: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 118

Sia C[x1, x2, x3]m lo spazio vettoriale dei polinomi omogenei di grado m. Una base diC[x1, x2, x3]m e data dai monomi

xa11 x

a22 x

a33 , a1 + a2 + a3 = m.

E’ facile verificare che C[x1, x2, x3]m e un sottospazio sl(3,R)-invariante che e anche sl(3) =sl(3,R)⊗R C invariante. La complessificazione di ρ da allora le rappresentazioni

ρm : sl(3) −→ End(C[x1, x2, x3]m).

Un vettore massimale di ρm e un F ∈ C[x1, x2, x3]m tale che ρm(Xα)F = 0 per ogni α ∈ R+.Allora α = Li − Lj con i < j, ρm(Xα) = xi∂/∂xj e F soddisfa:

x1∂F

∂x2

= 0 e x2∂F

∂x3

= 0.

In particolare, ∂F/∂xj = 0 per j = 2, 3 quindi F = cxm1 per uno scalare c ∈ C. Quindi ρm ha ununico vettore massimale (a meno di moltiplicazione per uno scalare) e percio ρm e irriducibile.Il peso del vettore massimale e:

ρm(H)(xm1 ) = (t1x1∂

∂x1

+ t2x2∂

∂x2

+ t3x3∂

∂x3

)(xm1 ) = mt1 xm1 = mL1(H)xm1 ,

quindi il peso massimale e mL1. Dato che λ1 = L1, questo mostra che

V (mλ1) ∼= C[x1, x2, x3]m = SmV,

detto l’m-esimo prodotto simmetrico della rappresentazione standard V . Si verifica che ognimonomio e un vettore peso:

ρm(H)(xa11 x

a22 x

a33 ) = (a1L1 + a2L2 + a3L3)(H)xa1

1 xa22 x

a33 .

I pesi sono quindi della forma a1L1 + a2L2 + a3L3 con ai ≥ 0 e∑ai = m. Questi pesi sono

distinti tra di loro, percio ogni spazio peso ha dimensione uno cioe ogni peso ha moltiplicitauno.

Nel diagramma qui sotto sono indicati i pesi e i monomi di S3V = C[x, y, z]3. Il diagrammadei vettori peso di SmV e un triangolo con vertici mL1, mL2 e mL3, ogni peso nell’interno del

Page 119: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 119

triangolo (inclusi quelli sul bordo) e un peso di SmV e ha molteplicita uno.

tttt

ttt

tt

t

3L12L1 + L2L1 + 2L23L2

L1 + 2L2L1 + L2 + L32L2 + L3

L1 + 2L3L2 + 2L3

3L3

x3x2yxy2y3

x2zxyzy2z

xz2yz2

z3

6.5.2 Il duale del prodotto simmetrico. Si ricordi che l’azione di A ∈ GL(n,C) sullospazio duale e data dalla matrice tA−1 (vedi 1.1.12). Per l’algebra di Lie questo implica (si usiun cammino γ(t) con γ(0) = I e γ′(0) = X) che l’azione di X ∈ g sullo spazio duale e datada −tX. In particolare, se V e una rappresentazione di g con pesi λ1, . . . , λr, i pesi di V ∗ sono−λ1, . . . ,−λr.

Poiche i pesi della rappresentazione SmV sono della forma a1L1 + a2L2 + a3L3 con ai ∈Z≥0 e

∑ai = m, i pesi della rappresentazione duale (SmV )∗ = Sm(V ∗) sono della forma

−(a1L1 + a2L2 + a3L3). In particolare, −mL3 = m(L1 + L2) e un peso dominante di questarappresentazione. Poiche per α ∈ R+, m(L1 + L2 + Ln) + α non e un peso, m(L1 + L2) e unpeso massimale di Sm(V ∗). Visto che SmV e irriducibile, anche il suo duale e irriducible (unsottospazio invariante W ⊂ SmV ∗ definisce un sottospazio W⊥ = x ∈ SnV : w(x) = 0 ∀w ∈SmV ∗ che e anch’esso invariante). Quindi

SmV ∗ = V (mλ2) dove λ2 = L1 + L2 = −L3.

6.5.3 I pesi del prodotto tensoriale di SmV e SnV ∗. Sia λ = mλ1 + nλ2 unpeso dominante di sl(3), cioe m,n ∈ Z≥0. La rappresentazione irriducibile V (λ) e unasottorappresentazione di

V (λ) = V (mλ1 + nλ2) → V (mλ1)⊗ V (nλ2) = (SmV )⊗ (SnV ∗), V = C3.

Page 120: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 120

Per trovare la decomposizione di (SmV ) ⊗ (SnV ∗) in rappresentazioni irriducibili, determini-amo i pesi di questa rappresentazione e la loro molteplicita. Poi troviamo i pesi, con le loromolteplicita, di ogni rappresentazione irriducibile V (λ) di sl(3), vedi 6.5.6.

Consideriamo prima un esempio, con m = m1 = 3, n = m2 = 2. Nel prossimo diagrammasono riportati i pesi della rappresentazione (S3V )⊗ (S2V ∗). Si noti che i pesi sull’esagono H0,che e il bordo del diagramma, sono somma di un peso di S3V e un peso di S2V ∗ in modo unico,quindi la molteplicita di un peso in H0 e uno.

Nel triangolo interiore T , con vertici 3L1 − 2L1 = L1, L2, L3, ogni peso e la somma di unpeso di S3V e un peso di S2V ∗ in 6 modi diversi. Infatti, µ = Li + (b1L1 + b2L2 + b3L3), conbi ∈ Z≥0 e

∑bi = 2, e sempre un peso di S3V , e ρ = −(b1L1 + b2L2 + b3L3) e un peso di S2V ∗.

Quindi per ognuno dei sei pesi ρ di S2V ∗ esiste un peso µ di S3V tale che Li = µ+ ρ.Non e difficile vedere che un peso sull’esagono H1, in mezzo tra H0 e T e indicato con le

linee tratteggiate, e la somma di un peso di S3V e un peso di S2V ∗ in 3 modi diversi. Peresempio,

2L1 − L3 = 3L1 − (L1 + L3) = (2L1 + L2)− (L2 + L3) = (2L1 + L3)− 2L3,

si noti che si usano soltanto i 3 pesi di S2V ∗ nel triangolino formato dalle prime due righe.

sssssss

sss

3L3

3L13L2

+

ss s

s s s

−2L3

−2L1 −2L2

=

sssssssss

sssssssssss

sssssss

3L1 − 2L33L2 − 2L3

3L1 − 2L23L2 − 2L1

3L3 − 2L1 3L3 − 2L2

L1

Si noti inoltre che ci sono 15 pesi su H0, 9 su H1 e 3 in T con molteplicita 1, 3 e 6 rispettivamente,e questo quadra con:

dim (S3V )⊗ (S2V ∗) = 10 · 6 = 60 = 15 + 27 + 18 = 15 · 1 + 9 · 3 + 3 · 6.

Nel caso m ≥ n il diagramma dei pesi di (SmV ) ⊗ (SnV ∗) e una unione di esagoniH0, H1, . . . Hm−n e un triangolo pieno T con vertici (m− n)L1, (m− n)L2, (m− n)L1.

La molteplicita di un peso in Hi e (i + 1)(i + 2)/2, per esempio se un peso λ ∈ Hi e sullato superiore dell’esagono, λ = µ+ ρ con ρ nel triangolino superiore del diagramma dei pesi diSnV ∗ formato dalle prime i+ 1 righe e µ un peso opportuno di SmV . Poiche questo triangolinoha (i+ 1)(i+ 2)/2 pesi, segue la molteplicita di λ.

Page 121: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 121

Se λ ∈ T , allora per ogni peso ρ di SnV ∗ c’e un peso µ di SnV tale che λ = µ + ρ, quindila molteplicita di un tale peso e dimSnV ∗ = (n + 1)(n + 2)/2. (Per vedere questo, si noti chesi puo scrivere λ = c1L1 + c2L2 + c3L3 con ci ∈ Z≥0 e

∑i ci = m− n, come nel diagramma dei

pesi di Sm−nV . Allora µ = λ + (b1L1 + b2L2 + b3L3), con bi ∈ Z≥0 e∑bi = n, e sempre un

peso di SmV . Poiche ρ = −(b1L1 + b2L2 + b3L3) e un peso di SnV ∗, si ha λ = µ + ρ per ognipeso ρ di SnV ∗.)

In conclusione, per un peso λ di (SmV )⊗ (SnV ∗) si ha:

dim (SmV ⊗ SnV ∗)λ =

(i+ 1)(i+ 2)/2 se λ ∈ Hi, i = 0, 1, . . . n− 1,

(n+ 1)(n+ 2)/2 se λ ∈ T.

6.5.4 La decomposizione di (SmV )⊗ (SnV ∗). Un peso massimale di (SmV )⊗ (SnV ∗) e

λ = mL1 − nL3 = (m+ n)L1 + nL2 = mλ1 + nλ2

perche λ + α non e un peso per α ∈ R+ (questi pesi sono o a destra (se α = α1) o sopra(se α = α2, α1 + α2) a λ nel diagramma dei pesi e non ci sono tali pesi). Poiche λ ∈ H0 hamolteplicita uno, lo spazio peso ((SmV ) ⊗ (SnV ∗))λ ha dimensione uno. Percio la sottorapp-resentazione generata da un vettore non-zero vλ in questo spazio genera una sottorappresen-tazione irriducibile di (SmV )⊗ (SnV ∗) isomorfa a Vλ. Per la teoria generale, esiste allora unasottorappresentazione W1 di (SmV )⊗ (SnV ∗) tale che

(SmV )⊗ (SnV ∗) = V (mλ1 + nλ2) ⊕ W ′.

Per trovare la decomposizione di W ′, dobbiamo trovare gli altri pesi massimali di (SmV )⊗(SnV ∗). Mostriamo che i soli pesi massimali in W1 sono

µi = (m−i)L1−(n−i)L3 = (m+n−2i)L1+(n−i)L2 = (m−i)λ1+(n−i)λ2 (i = 1, . . . , n),

e che ogni (W ′)µi contiene un unico, a meno di moltiplicazione per uno scalare, vettoremassimale. Da qui segue che, per m ≥ n,

(SmV )⊗ (SnV ∗) = V (mλ1 + nλ2) ⊕ V ((m− 1)λ1 + (n− 1)λ2)⊕ . . . ⊕ V ((m− n)λ1).

6.5.5 Dimostrazione di 6.5.4. Per mostrare l’affermazione sui pesi massimali, consideriamoprima un peso µ ∈ Hi, µ 6= µi. Usando il gruppo di Weyl, possiamo assumere che µ = µi− kα1

oppure µ = µi − kα2 con k > 0.

sss

ss

µi − 2α1 µi − α1 µi

µi − α2

µi − 2α2

sss

ss

µi − 2α1 µi − α1 µi

µi − (α1 + α2)

µi − 2(α1 + α2)

Page 122: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 122

Consideriamo la copia di sl(2) generata da Hα1 , X±α1 . Sia W1 la sottorappresentazione diquesto sl(2) generato dai vettori in Vµi . Si ha

µi(Hα1) = ((m− i)L1 − (n− i)L3)(diag(1,−1, 0)) = m− i,

quindi Vµi = (W1)m−i, e uno spazio peso di questo sl(2). Dalla teoria delle rappresentazioni disl(2) segue che

ρ(X−α1)k : (W1)m−i → (W1)m−i−2k

e iniettiva, per k = 0, 1, . . . ,m − i, con inversa ρ(Xα1)k. Si noti che ρ(X−α1)

kVµi = Vµi−kα1 ,quindi (W1)m−i−2k ⊂ Vµi−kα1 . Per k = 0, 1, . . . ,m − i, i pesi µi − kα1 sono esattamente i pesi(m − i − k)L1 + kL2 − (n − i)L3 sul lato superiore dell’esagono Hi. Poiche la molteplicita diun peso e costante sull’esagono, si ha dimVµi = dimVµi−kα1 , e quindi ρ(X−α1)

k : Vµi → Vµi−kα1

e un isomorfismo con inversa ρ(Xα1)k. Percio ρ(Xα1) : Vµi−kα1 → Vµi−(k−1)α1 e un isomorfismo

per k = 0, 1, . . . ,m− i, k 6= 0, in particolare, non ci sono vettori massimali in Vµi−kα1 per k 6= 0.In modo simile, usando la copia di sl(2) generata da Hα2 , X±α2 si vede che non ci sono

vettori massimali in Vµi−lα2 con µi − lα2 ∈ Hi e l 6= 0. Poi, ancora in modo simile, si mostrache non ci sono vettori massimali in Vµ per µ in un triangolo, tranne al piu in Vµm−n conµm−n = (m− n)L1.

Adesso mostriamo che c’e un unico vettore massimale, a meno di moltiplicazione per unoscalare, in ogni Vµi . Considerando il triangolo formato dalle prime i righe del diagramma deipesi di SnV ∗, si vede che se µi = λ+ ρ con λ, ρ pesi di SmV , SnV ∗ rispettivamente, allora

µi = µ+ρ, µ = (m− i)L1 +(c1L1 + c2L2 + c3L3) ρ = −(n− i)L3− (c1L1 + c2L2 + c3L3),

con cj ∈ Z≥0 e∑cj = i. Il vettore peso corrispondente a questa decomposizione e

vc := e(m−i+c1,c2,c3) ⊗ e(c1,c2,n−i+c3)∗ ,

dove

ed = e(d1,d2,d3) := (e1)d1 (e2)d2 (e3)d3 , ed∗ = e(d1,d2,d3)∗ := (e∗1)d1 (e∗2)d2 (e∗3)d3 ,

dove e∗1, e∗2, e∗3 sono i vettori della base duale. Definiamo ed = 0, ed∗ = 0 se una delle di e negativa.

Si noti che ed corrisponde al monomio xd1yd2zd3 .Adesso calcoliamo l’azione di Xα1 = E1,2 su vc, si ricordi che E1,2e1 = 0, E1,2e2 = e1, E1,2e3 =

0, e nella rappresentazione duale l’azione e data da−tE1,2 = −E2,1 quindi e∗1 7→ −e∗2 e e∗2, e∗3 7→ 0.

Percio si ha:

ρ(Xα1)vc = c2e(m−i+c1+1,c2−1,c3)1 ⊗ e(c1,c2,n−i+c3)

∗ − c1e(m−i+c1−1,c2+1,c3) ⊗ (e∗)

(c1−1,c2+1,n−i+c3)

Sia v =∑

c xcvc ∈ Vµi , con xc ∈ C, allora

v =∑c

xcvc ∈ ker ρ(Xα1) =⇒ c2cv = (c1 + 1)c(c1+1,c2−1,c3).

Page 123: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 123

In modo simile, si trova

v =∑c

xcvc ∈ ker ρ(Xα2) =⇒ c3xc = (c2 + 1)x(c1,c2+1,c3−1).

L’ultima formula implica che se c(0,0,i) = 1, allora c(0,1,i−1) = i, poi c(0,2,i−2) = i(i− 1)/2 ecc. Siusa poi la prima formula per determinare c(p,q,r) per ogni p, q, r ∈ Z≥0, p+ q+ r = i. Il risultatoe che v e un multiplo del vettore

∑c(c1!c2!c3!)−1vc. Quindi c’e un unico vettore massimale in

(SmV ⊗ SnV ∗)µi .

6.5.6 I pesi di V (mλ1 + nλ2). Adesso siamo in grado di determinare i pesi della rappre-sentazione irriducibile V (mλ1 + nλ2) e le loro molteplicita. Per il caso n = 0, V (mλ1) = SmVsi veda 6.5.1. Nel caso n = 1, si noti che

(SmV )⊗ V ∗ = V (mλ1 + λ2) ⊕ SmV.

Il diagramma dei pesi di (SmV )⊗ V ∗ e un esagono H0 con vertici mL1 −L3 = (m+ 1)L1 +L2

e le sue orbite attraverso il gruppo di Weyl e il triangolo T (bordo e interno) con vertici mLi,i = 1, 2, 3. I pesi su H0 e T hanno molteplicita 1 e 3 rispettivamente, vedi 6.5.3. I pesi di SmVsono i punti del triangolo, ognuno ha molteplicita uno. Quindi i pesi di V (mλ1 + λ2) sono ipesi in H0, con molteplicita 1− 0 = 1 e i pesi di T , con molteplicita 3− 1 = 2.

Per m ≥ n generale, si noti che

(SmV )⊗ (SnV ∗) = V (mλ1 + nλ2)⊕ V ((m− 1)λ1 + (n− 1)λ2)⊕ . . .⊕ V ((m− n)λ1)= V (mλ1 + nλ2)⊕ (Sm−1V )⊗ (Sn−1V ∗).

Quindi un peso λ di V (mλ1 + nλ2) ha molteplicita

dim (V (mλ1 + nλ2))λ = dim((SmV )⊗ (SnV ∗))λ − dim((Sm−1V )⊗ (Sn−1V ∗))λ.

Usando il risultato di 6.5.3 e (i+ 1)(i+ 2)/2− i(i+ 1)/2 = i+ 1, troviamo:

dim (V (mλ1 + nλ2))λ =

i+ 1 se λ ∈ Hi, i = 0, . . . , n− 1,n+ 1 se λ ∈ T.

6.5.7 Esempio: SmV ⊗V . Determiniamo la decomposizione della rappresentazione SmV ⊗Vdi sl(3), dove V = C3 e la rappresentazione standard. I pesi di SmV sono gli a1L1 +a2L2 +a3L3

con ai ∈ Z≥0 e∑ai = m, in particolare, i pesi di V sono L1, L2, L3, vedi 6.5.1. Ogni peso ha

molteplicita uno.I pesi di SmV ⊗V si scrivono allora tutti come c1L1+c2L2+c3L3 con ci ∈ Z≥0 e

∑ci = m+1.

Si noti che questi sono anche i pesi di Sm+1V e il diagramma dei pesi e un triangolo con vertici(m+1)Li. La molteplicita dei pesi (m+1)Li, i = 1, 2, 3, e uno, perche l’unico modo di ottenere(m+ 1)Li come somma di pesi di SmV e V e (m+ 1)Li = mLi +Li. Se esattamente uno dellecj = 0, diciamo c3 = 0, allora ci sono due modi di ottenere c1L1 + c2L2 come somma:

c1L1 + c2L2 = (c1 − 1)L1 + c2L2 = c1L1 + (c2 − 1)L2

Page 124: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 124

quindi la molteplicita di ogni peso sul bordo del triangolo, che non sia un vertice, e due. Poiogni peso nell’interno del triangolo ha ci ≥ 1 per ogni i e quindi ha molteplicita tre:

c1L1 + c2L2 + c3L3 = ((c1 − 1)L1 + c2L2 + c3L3) +L1 = . . . = (c1L1 + c2L2 + (c3 − 1)L3) +L3.

Nel diagramma qui sotto i pesi sull’esagono indicato hanno molteplicita due, il vertice (m+1)L1

del diagramma ha molteplicita uno e i pesi nell’interno dell’esagono hanno molteplicita 3.

sss

ss

(m− 1)L1 + 2L2 mL1 + L2 (m+ 1)L1

mL1 + L3

mL1 + 2L3

sss

mL1

Il peso (m+ 1)L1 e massimale perche (m+ 1)L1 + (Li−Lj) non e un peso se i > j. La suamolteplicita e uno, quindi V ((m+ 1)L1) = Sm+1V compare con molteplicita uno in SmV ⊗ V .Togliendo i pesi di Sm+1V , si vede che rimane un diagramma esagonale, con vertici

mL1 + L2 = (m− 1)λ1 + λ2

e la sua immagine per il gruppo di Weyl (che permuta gli Li). I pesi sul bordo dell’esagono hannomolteplicita 2− 1 = 1, i pesi nell’interno, che e un triangolo con vertici mL1,mL2,mL3 hannomolteplicita 3− 1 = 2. Questi sono esattamente i pesi, con molteplicita, della rappresentazioneirriducibile V ((m− 1)λ1 + λ2). Quindi si ha:

SmV ⊗ V = Sm+1V ⊕ V ((m− 1)λ1 + λ2).

Si noti che il nucleo dell’applicazione suriettiva

SmV ⊗ V −→ Sm+1V, F ⊗G 7−→ FG

e allora V ((m− 1)λ1 + λ2).

6.5.8 Esempio: V ⊗ V ⊗ V . I pesi della rappresentazione standard V = C3 di sl(3)sono L1, L2, L3; siano e1, e2, e3 i vettori peso: Hei = Li(H)ei. Allora la rappresentazioneW := V ⊗V ⊗V , di dimensione 33 = 27, ha una base di vettori peso data dalle ei⊗ej⊗ek (conpeso Li + Lj + Lk). In particolare, i pesi di W sono aL1 + bL2 + cL3 = (a− c)L1 + (b− c)L2,con a+ b+ c = 3 e a, b, c ≥ 0.

Per decomporre W in rappresentazioni irriducibili, determiniamo le molteplicita dei pesidominanti, cioe dei pesi aL1 + bL2 + cL3 = (a − c)L1 + (b − c)L2 con a − c ≥ b − c ≥ 0, cioe

Page 125: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 125

a ≥ b ≥ c (vedi 8.3.1). Quindi questi pesi sono 3L1, 2L1 +L2, L1 +L2 +L3. Segue gia che se Vλe una componente irriducibile di W , allora λ e uno di questi tre pesi. La molteplicita dei pesidi W e:

peso dominante molteplicita vettori peso3L1 = 3λ1 1 e1 ⊗ e1 ⊗ e1

2L1 + L2 = λ1 + λ2 3 e1 ⊗ e1 ⊗ e2, e1 ⊗ e2 ⊗ e1, e2 ⊗ e1 ⊗ e1

L1 + L2 + L3 = 0 6 e1 ⊗ e2 ⊗ e3, e1 ⊗ e3 ⊗ e2, e2 ⊗ e1 ⊗ e3

e2 ⊗ e3 ⊗ e1, e3 ⊗ e1 ⊗ e2, e3 ⊗ e2 ⊗ e1

Poiche 3L1 e un peso massimale (3L1 + α non e un peso di W per nessuna radice α > 0, cioeper α = L1 − L2, L1 − L3, L2 − L3), ed ha molteplicita uno. Quindi V (3λ1) e una componenteirriducibile di W e compare una volta sola in W . Il diagramma dei pesi di V (3λ1) e un triangolo(infatti V (3λ1) ∼= Sym3(V ), vedi 6.5.1) e quindi ogni peso di V (3λ1) ha molteplicita uno (vedi6.5.6). Percio W = V (3λ1)⊕W ′ e i pesi dominanti di W ′ sono

2L1 + L2 = λ1 + λ2 con molteplicita 3− 1 = 2,L1 + L2 + L3 = 0 ,, ,, 6− 1 = 5.

Si noti che 2L1+L2 e un peso massimale di W ′ e ha molteplicita due, quindi W ′ = V (λ1 + λ2)2⊕W ′′. Il peso L1 +L2 +L3 di V (λ1 + λ2) ha molteplicita 2 (il diagramma dei pesi di V (λ1 + λ2)e un esagono H0 e un triangolo T ridotto ad un solo punto 0 = L1 + L2 + L3, poi si usi 6.5.6).Quindi W ′′ ha un unico peso dominante, L1 +L2 +L3 = 0, con molteplicita 5−2 ·2 = 1, percioW ′′ = V (0) ∼= C, e la rappresentazione banale di sl(3). In conclusione:

V ⊗ V ⊗ V = V (3λ1) ⊕ V (λ1 + λ2)2 ⊕ V (0).

Si verifica anche facilmente che dimV (3λ1) = 10, dimV (λ1 + λ2) = 8 e che 27 = 10 + 2 · 8 + 1,come dovrebbe essere. Questa decomposizione si ottiene anche con i funtori di Schur (si veda8.3.2 e Teorema 3.2.6):

V ⊗ V ⊗ V = T 3V = V(3) ⊕ V 2(2,1) ⊕ V(1,1,1).

Page 126: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 126

c

c

ccc

c

cc

c

cccc

j6 j3j3

j3

j3

j3

j3

j1j1

j1

3L13L2

3L3

2L1 + L3

2L1 + L2L1 + 2L2

2L2 + L3

L2 + 2L3 L1 + 2L3

L1 + L2 + L3

L3

L1L2

6.5.9 Le algebre di Lie su(n) e sl(n)C. Una rappresentazione ρ : sl(n)C → End(V ) del-l’algebra di Lie complessa sl(n)C su uno spazio vettoriale complesso V definisce, per restrizione,una rappresentazione dell’algebra di Lie su(n) ⊂ sl(n)C. Si puo mostrare che in questo modosi ottiene una biiezione tra le rappresentazioni irriducibile di sl(n)C (di dimensione finita) e lerappresentazioni di su(n). Data una rappresentazione σ : su(n)→ End(V ), in particolare σ eR-lineare, la rappresentazione di sl(n)C = su(n) ⊗R C corrispondente e l’estensione C-lineareσC di σ: σC(X ⊗ z) := zσ(X) per X ∈ su(n) e z ∈ C.

L’algebra di Lie su(n) e lo spazio vettoriale reale definito da

su(n) = X ∈Mn(C) : tX + X = 0, tr(X) = 0

(si noti che X ∈ su(n) e X 6= 0 allora iX 6∈ su(n)). In particolare, una matrice diagonaleH = diag(t1, . . . , tn) ∈ su(n) se e solo se ti = −ti e

∑ti = 0. In piu, se X ∈ su(n) allora anche

X ∈ su(n).Data una rappresentazione ρ di sl(n)C, il suo duale ρ∗ e dato da ρ∗ : X 7→ −tρ(X) (perche

per il gruppo di Lie la rappresentazione duale e data da A 7→ tA−1 (si veda 1.1.12), quindi siprenda la derivata in A = I). Quindi se λ e un peso con molteplicita k per ρ, allora −λ e unpeso con molteplicita k per ρ∗. Data una rappresentazione σ : su(n) → End(V ) si definisceuna rappresentazione dell’algebra di Lie reale su(n), detta la sua coniugata complessa, con

σ : su(n) −→ End(V ), X 7−→ σ(X).

Page 127: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 127

Poiche X = −tX per X ∈ su(n), se λ e un peso con molteplicita k per σ, allora −λ e un pesocon molteplicita k per σ. In particolare, se σ e la restrizione della rappresentazione ρ di sl(n)a su(n), allora σ e la restrizione della rappresentazione duale ρ∗.

Di solito i fisici indicano le rappresentazioni di su(n) (e di tutti le altre algebre di Lie)con la loro dimensione, eventualmente con qualche indice per distinguere rappresentazioni nonequivalenti con la stessa dimensione. Per esempio, qui sotto diamo un dizionario che da illegame tra le rappresentazioni di sl(3)C e di su(3):

V0 ←→ 1, VL1 ←→ 3, VL1+L2 = V ∗L1←→ 3, V2L1+L2 ←→ 8, V3L1 ←→ 10.

I prodotti tensoriali sono tipicamente indicati con un × invece di un ⊗, e analogamenteinvece di ⊕ scrivono +, per esempio:

VL1 ⊗ VL1+L2 = V2L1+L2 ⊕ V0 ←→ 3× 3 = 8 + 1,

VL1 ⊗ VL1 ⊗ VL1 = V3L1 ⊕ V 22L1+L2

⊕ V0 ←→ 3× 3× 3 = 10 + 8 + 8 + 1.

6.6 La forma di Killing per sl(3).

6.6.1 In questa sezione definiamo la forma di Killing per l’algebra di Lie sl(3) e mostriamoche dalla forma di Killing si ottiene in modo naturale il prodotto scalare su h∗ introdotto in6.1.8, a meno di uno scalare.

6.6.2 Una forma bilineare su End(V ). Sia V uno spazio vettoriale complesso. Lo spaziovettoriale complesso End(V ) ha una forma bilineare ‘naturale’ data da BV (X, Y ) := Tr(XY )dove Tr(Z) e la traccia dell’endomorfismo Z di V . Scegliendo una base di V , cioe un isomorfismoV ∼= Cn, si puo esplicitare tale forma bilineare e si ottiene:

Bn : Mn(C)×Mn(C) −→ C, Bn(X, Y ) = Tr(XY ) =n∑l=1

(n∑k=1

XlkYkl),

dove Tr(Z) =∑

l Zll e la traccia della matrice Z. La formula per Bn mostra che Tr(XY ) =Tr(Y X), quindi B e simmetrico: B(X, Y ) = B(Y,X) per ogni X, Y ∈ End(V ). Poiche latraccia e lineare, Tr(λX + µY ) = λTr(X) + µTr(Y ), si ha Tr([X, Y ]) = Tr(XY − Y X) = 0.

Un’altra proprieta importante della forma di Killing e:

B([X, Y ], Z) = B(X, [Y, Z]) (∀X, Y, Z ∈Mn(C)),

cioe, che vale Tr((XY − Y X)Z) = Tr(X(Y Z − ZY )). Per mostrarlo si consideri la differenzatra i due lati e si usi:

Tr((XY − Y X)Z −X(Y Z − ZY )) = Tr(XZY − Y XZ) = Tr([XZ, Y ]) = 0,

come appena visto.

Page 128: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 128

La rappresentazione aggiunta di un’algebra di Lie semplice g da una inclusione ad : g →End(g) ∼= Mn(C) dove n = dim g. Quindi otteniamo una forma bilineare su g, detta forma diKilling, definita da

B : g× g −→ C, B(X, Y ) := Bg(ad(X), ad(Y ))

e, come appena visto, questa forma bilineare soddisfa B([X, Y ], Z) = B(X, [Y, Z]).Una proprieta importante della forma di Killing e che e nondegenere, cioe, per ogni X ∈ g,

X 6= 0, esiste uno Z ∈ g tale che B(X,Z) 6= 0.

6.6.3 La forma di Killing su h. L’algebra di Cartan h ha dimensione 2 e ha C-base H12 =diag(1,−1, 0), H23 = diag(0, 1,−1). Mostriamo che la restrizione di B ad h e non-degenere conun calcolo esplicito. Dall’ equazione 2 di 6.1.2 si ha:

ad(H12) = diag(0, 0, 2,−1,−1,−2,−1,−1)ad(H23) = diag(0, 0,−1, 2, 1, 1,−2,−1)

quindi:

ad(H12)ad(H12) = diag(0, 0, 4, 1, 1, 4, 1, 1) Tr(ad(H12)ad(H12)) = 12,ad(H23)ad(H23) = diag(0, 0, 1, 4, 1, 1, 4, 1) Tr(ad(H23)ad(H23)) = 12,ad(H12)ad(H23) = diag(0, 0,−2,−2, 1,−2,−2, 1) Tr(ad(H12)ad(H23)) = −6,

e, per simmetria di B, allora anche B(H23, H12) = −6. Segue che

B(x1H12+x2H23, y1H12+y2H23) = 6(x1 x2)

(2 −1−1 2

)(y1

y2

)= 6(2x1y1−x1y2−x2y1+2x2y2).

Poiche la matrice (2−1−1 2) ha determinante 6= 0, la forma di Killing ristretta ad h e non-degenere.

Questo implica che B definisce una dualita, sempre indicata con B, cioe un isomorfismo:

B : h∗∼=−→ h, α 7−→ Tα se α(H) = B(Tα, H)

per ogni H ∈ h, cioe le forme lineari α e B(Tα,−) sono la stessa su h. Tramite questoisomorfismo si definisce un prodotto scalare su h∗R nel modo seguente:

(α, β)B := (Tα, Tβ) (α, β ∈ h∗R).

Per calcolare il prodotto scalare in modo esplicito determiniamo Ti := Tαi ∈ h per i = 1, 2.Si noti che α1(H) = t1 − t2 se H = diag(t1, t2, t3) ∈ h. D’altre parte, T1 = x1H12 + x2H23 percerte xi ∈ C e, poiche t1 + t2 + t3 = 0, H = diag(t1, t2, t3) = t1H12 + (t1 + t2)H23, quindi

B(Tα, H) = B(x1H12 + x2H23, t1H12 + (t1 + t2)H23)

= 6(

2x1t1 − x1(t1 + t2)− x2t1 + 2x2(t1 + t2))

= 6(x1 + x2)t1 + 6(−x1 + 2x2)t2

Page 129: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

6 LE RAPPRESENTAZIONI DELL’ALGEBRA DI LIE SL(3) 129

percio si ha: α1(H) = B(T1, H) per ogni H ∈ h se e solo se 6(x1 +x2) = 1, 6(−x1 +2x2) = −1;quindi x1 = 1/6, x2 = 0 e percio T1 = H12/6. In modo simile si ha T2 = H23/6. Allora

(α1, α2)B = (H12/6, H23/6) = −1/6, (α1, α1)B = (α2, α2)B = 2/6,

e questo e, a meno di una fattore 1/6, il prodotto scalare (−,−) su h∗R. Si noti che

Hα1 := H12 =2

B(T1, T1)T1, Hα2 := H23 =

2

B(T2, T2)T2

(si veda 7.1.11 per il caso generale).

Page 130: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 130

7 La classificazione delle algebre di Lie semisemplici

Testi consigliati: [FH], [Ha], [Hu].

7.1 L’algebra di Cartan e i pesi.

7.1.1 Introduzione. In questo capitolo daremo la classificazione delle algebre di Lie complessesemplici.

Il risultato e che ci sono quattro famiglie, parametrizzate da interi positivi, di algebre di Liecomplesse semplici g e poi ci sono 5 casi ‘eccezionali’, si veda 7.3.3. La classificazione sfruttal’azione di una sottoalgebra ‘di Cartan’ h di g nella rappresentazione aggiunta su g. Risultache nello spazio vettoriale duale h∗ e definito un sottospazio reale h∗R generato da certi vettori,chiamati radici di g. L’insieme delle radici di g e un sistema di radici, questo concetto e definitoin 7.2.2. Si mostra che esiste una biiezione tra sistemi di radici ‘irriducibili’ e algebre di Liecomplesse semplici. Poi si da la classificazione dei sistemi di radici.

7.1.2 L’algebra di Cartan. Sia g un’algebra di Lie complessa semplice. Una sottoalgebra diLie h ⊂ g e detta un’algebra di Cartan se h e abeliana, se ogni elemento di h e diagonalizzabile(in una e quindi in ogni rappresentazione di g, vedi 5.4.5) e se h e massimale rispetto a taleproprieta (vedi [FH], Definition D.2).

Si puo mostrare che se h, h′ sono due algebre di Cartan di g, allora esiste un automorfismog→ g′ che manda h in h′, quindi h e essenzialmente unica (vedi [FH] D.3).

Il rango l di g e la dimensione di un’algebra di Cartan di g:

l = rango(g) := dimC h.

7.1.3 Pesi delle rappresentazioni. Sia h un’algebra di Cartan di g e sia

ρ : g −→ End(V )

una rappresentazione di g.Poiche ρ(H) per ogni H ∈ h e diagonalizzabile, si puo decomporre V in autospazi per ρ(H).

Se H,H ′ ∈ h e Vλ ⊂ V e l’autospazio di ρ(H) con autovalore λ, allora ρ(H ′)Vλ ⊂ Vλ perche:

ρ(H)(ρ(H ′)X) = ρ(H ′)(ρ(H)X) = ρ(H ′)(λX) = λ(ρ(H ′)X), (X ∈ Vλ).

Quindi Vλ ha una decomposizione in autospazi per H ′. Procedendo in questo modo, usandouna base H1, . . . , Hl di h, si trova una decomposizione V = ⊕Vλ1,...,λl tale che Hiv = λiv perv ∈ Vλ1,...,λl . Poiche ogni H ∈ h si scrive come H =

∑xiHi, si ha Hv = (

∑λixi)v. Quindi un

autospazio Vλ1,...,λl definisce una mappa lineare (un ‘peso’)

L : h −→ C, H =l∑

i=1

xiHi 7−→l∑

i=1

λixi, tale che ρ(H)v = L(H)v

Page 131: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 131

per ogni v ∈ Vλ1,...,λl . Si scrive VL := Vλ1,...,λl e VL e detto uno spazio peso (invece di au-tospazio per tutti gli elementi di h) con peso L ∈ h∗, lo spazio duale di h. In particolare, ognirappresentazione V di g ha una decomposizione in spazi peso:

V = ⊕L∈h∗VL, ρ(H)v = L(H)v (∀v ∈ VL).

Poiche dimV e finita, VL = 0 tranne che per un numero finito di L ∈ h∗, questi L sono detti ipesi della rappresentazione ρ e la moltiplicita di un peso L e la dimensione di VL.

7.1.4 La rappresentazione aggiunta. La rappresentazione aggiunta di un’algebra di Lie g

e (vedi 5.2.5):ad : g −→ End(g), X 7−→ (ad(X) : Y 7→ [X, Y ]).

Poiche h e abeliana, si ha [H,H ′] = 0 · H ′ = 0 per ogni H,H ′ ∈ h e quindi h e contenu-ta nell’autospazio g0 con peso 0. Si puo mostrare che ogni elemento in questo autospazio ediagonalizzabile e quindi sta in h, percio g0 = h.

Otteniamo allora la decomposizione in autospazi (spazi peso) per l’algebra di Cartan:

g = h ⊕ (⊕α∈h∗−0 gα),

dove il sottospazio gα e definito da:

gα := X ∈ g : [H,X] = α(H)X .

7.1.5 Le radici di un’algebra di Lie semisemplice. Un elemento α ∈ h∗ e detto unaradice (inglese: root) di g se α 6= 0 e gα 6= 0. Poiche dim g e finita, ci sono soltanto un numerofinito di radici. L’insieme delle radici e indicato con R.

Lo spazio radice (inglese root space) e l’autospazio gα di g, dove α ∈ R.

7.1.6 Le radici di sl(n). L’algebra di Lie sl(n) del gruppo di Lie SL(n) e data da:

sl(n) = X ∈Mn(C) : Tr(X) := X11 + . . .+Xnn = 0

(vedi 5.1.7), in particolare, dim sl(n) = n2 − 1. Sia h il sottospazio di sl(n) delle matricidiagonali:

h = H ∈ sl(n) : Hij = 0 se i 6= j = diag(t1, . . . , tn) ∈Mn(C) : t1 + . . .+ tn = 0 .

Poiche H1H2 = H2H1 se H1, H2 sono matrici diagonali, si ha [H1, H2] = 0 per ogni H1, H2 ∈ h

e quindi h e abeliana e diagonalizzabile (perche gia diagonalizzata!).Si noti che se H = diag(t1, . . . , tn) e X = (Xij) ∈ Mn(C) allora (HX)ij = tiXij, cioe la

i-esima riga di HX e quella di X, moltiplicata per ti. Similmente, (XH)ij = tjXij, cioe laj-esima colonna di (HX) e quella di X, moltiplicata per tj. Percio, [H,X] e la matrice concoefficienti dati da

[H,X]ij = (ti − tj)Xij, H = diag(t1, . . . , tn).

Page 132: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 132

A questo punto e facile trovare gli spazi radice. Sia Ei,j la matrice ‘elementare’:

Ei,j ∈Mn(C), (Ei,j)kl = δikδjl

dove δab e il delta di Kronecker: δab = 1 se a = b e zero altrimenti. In particolare, tutti icoefficienti di Ei,j sono zero tranne (Ei,j)ij = 1. Allora

[H,Ei,j] = (ti − tj)Ei,j.

Poiche gli Ei,j sono una base di Mn(C), l’insieme delle radici di sl(n) e:

R = αij := Li − Lj ∈ h∗ : 1 ≤ i, j ≤ n, i 6= j ,

doveLi : h −→ C, Li(diag(t1, . . . , tn)) = ti.

Poiche∑ti = 0 gli Li ∈ h∗ non sono indipendenti in h∗ ma si ha:

L1 + . . .+ Ln = 0 ∈ h∗.

Una base di gαij e data dalla matrice ‘elementare’ Ei,j:

gαij = CEi,j.

Si noti che ogni spazio radice e proprio unidimensionale.Per essere concreti, nel caso n = 3 si ha:

HX =

t1 0 00 t2 00 0 t3

x11 x12 x13

x21 x22 x23

x31 x32 x33

=

t1x11 t1x12 t1x13

t2x21 t2x22 t2x23

t3x31 t3x32 t3x33

,

e poi:

[H,X] = HX −XH =

t1x11 t1x12 t1x13

t2x21 t2x22 t2x23

t3x31 t3x32 t3x33

− t1x11 t2x12 t3x13

t1x21 t2x22 t3x23

t1x31 t2x32 t3x33

=

0 (t1 − t2)x12 (t1 − t3)x13

(t2 − t1)x21 0 (t2 − t3)x23

(t3 − t1)x31 (t3 − t2)x32 0

.

Quindi gli autovalori non nulli di ad(H) sono: ±(t1− t2),±(t1− t3),±(t2− t3). Percio sl(3) hasei radici: R = ±(L1 − L2),±(L1 − L3),±(L2 − L3).

7.1.7 Commutatori e radici. L’insieme delle radici R ⊂ h∗ determina l’algebra di Liesemplice g. Un primo passo per capire come mai cio capita e la proprieta:

[gα, gβ] ⊆ gα+β (α, β ∈ R),

Page 133: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 133

in particolare [gα, gβ] = 0 se α+β 6∈ R. La dimostrazione e facile, sia Xα ∈ gα, Xβ ∈ gβ, allora

[H, [Xα, Xβ]] = [[H,Xα], Xβ] + [Xα, [H,Xβ]]

= α(H)[Xα, Xβ] + β(H)[Xα, Xβ]

= (α + β)(H)[Xα, Xβ]

e percio [Xα, Xβ] ∈ gα+β, dove abbiamo usato l’identita di Jacobi come in 5.2.5. Si puo mostrareche [gα, gβ] = gα+β se α + β ∈ R.

7.1.8 La forma di Killing. Sia V uno spazio vettoriale complesso. Lo spazio vettorialecomplesso End(V ) ha una forma bilineare ‘naturale’ data da BV (X, Y ) := Tr(XY ) dove Tr(Z)e la traccia dell’endomorfismo Z di V . Scegliendo una base di V , cioe un isomorfismo V ∼= Cn,si puo esplicitare tale forma bilineare e si ottiene:

Bn : Mn(C)×Mn(C) −→ C, Bn(X, Y ) = Tr(XY ) =n∑l=1

(n∑k=1

XlkYkl),

dove Tr(Z) =∑

l Zll e la traccia della matrice Z. La formula per Bn mostra che Tr(XY ) =Tr(Y X), quindi B e simmetrico: B(X, Y ) = B(Y,X) per ogni X, Y ∈ End(V ). Poiche latraccia e lineare, Tr(λX + µY ) = λTr(X) + µTr(Y ), si ha Tr([X, Y ]) = Tr(XY − Y X) = 0.

Un’altra proprieta importante della forma di Killing e:

B([X, Y ], Z) = B(X, [Y, Z]) (∀X, Y, Z ∈Mn(C)),

cioe, che vale Tr((XY − Y X)Z) = Tr(X(Y Z − ZY )). Per mostrarlo si considera la differenzatra i due lati e si usa:

Tr((XY − Y X)Z −X(Y Z − ZY )) = Tr(XZY − Y XZ) = Tr([XZ, Y ]) = 0,

come appena visto.La rappresentazione aggiunta di un’algebra di Lie semplice g da una inclusione ad : g →

End(g) ∼= Mn(C) dove n = dim g. Quindi otteniamo una forma bilineare su g, detta forma diKilling, definita da

B : g× g −→ C, B(X, Y ) := Bg(ad(X), ad(Y ))

e, come appena visto, questa forma bilineare soddisfa B([X, Y ], Z) = B(X, [Y, Z]).La forma di Killing e nondegenere, cioe, per ogni X ∈ g, X 6= 0, esiste uno Z ∈ g tale che

B(X,Z) 6= 0. Per mostrare cio, si definisce il nucleo di B:

ker(B) := X ∈ g : B(X,Z) = 0 ∀Z ∈ g

e si mostra che ker(B) = 0. Si noti che ker(B) e un sottospazio lineare di g. In piu, se X, Y ∈ g

sono tali che B(X,Z) = B(Y, Z) = 0 per ogni Z ∈ g allora anche B([X, Y ], Z) = B(X, [Y, Z]) =

Page 134: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 134

B(X,Z ′) = 0. Quindi ker(B) e un ideale di g e, poiche g e semplice, ker(B) = 0 oppureker(B) = g. Poi si dimostra che ker(B) 6= g, per esempio usando un risultato di Cartan.

7.1.9 La simmetria R = −R. Siano α, β ∈ h∗ e Xα ∈ gα, Xβ ∈ gβ. Se α + β 6= 0 ∈ h∗,allora esiste un H ∈ h tale che (α + β)(H) 6= 0. Si ha:

α(H)B(Xα, Xβ)=B([H,Xα], Xβ) = −B([Xα, H], Xβ) = −B(Xα, [H,Xβ])=−β(H)B(Xα, Xβ),

percio (α+ β)(H)B(Xα, Xβ) = 0 e quindi B(Xα, Xβ) = 0. In particolare, gli autospazi gα e gβsono perpendicolari se α + β 6= 0:

gα ⊥B gβ se α + β 6= 0.

Sia adesso α ∈ R e Xα ∈ gα, Xα 6= 0. Supponiamo che g−α = 0. Allora B(Xα, Xβ) = 0 per ogniXβ ∈ gβ e per ogni β ∈ h∗. Ma allora B(Xα, X) = 0 per ogni X ∈ g = ⊕gβ, in contraddizionecon il fatto che B e nondegenere su g. Quindi g−α 6= 0 se gα 6= 0.

7.1.10 La forma di Killing e l’algebra di Cartan. La restrizione della forma di Killingad h e nondegenere perche se H ∈ h allora esiste un X ∈ g tale che B(H,X) 6= 0. AlloraX = X0 +

∑αXα con X0 ∈ h e Xα ∈ gα. Se α ∈ R, α 6= 0 e quindi α + 0 6= 0 e in 7.1.9

abbiamo visto che cio implica B(H,Xα) = 0. Quindi B(H,X0) 6= 0 e poiche X0 ∈ g0 = h segueche B non e degenere su h.

Poiche B e nondegenere su h, B definisce una dualita, sempre indicata con B, cioe unisomorfismo:

B : h∗∼=−→ h, α 7−→ Tα se α(H) = B(Tα, H)

per ogni H ∈ h. Si noti che α(Tα) = B(Tα, Tα).

7.1.11 Copie di sl(2) in g. Sia α ∈ R, quindi anche −α ∈ R e [gα, g−α] ⊂ g0 = h. Mostriamoche

[Xα, X−α] = B(Xα, X−α)Tα se Xα ∈ gα, X−α ∈ g−α,

dove Tα ∈ h e definito in 7.1.10. Da questo segue che [gα, g−α] = CTα perche ci sono Xα, X−αtale che B(Xα, X−α) 6= 0 (vedi 7.1.9).

Sia H ∈ h, allora si ha:

B(H, [Xα, X−α]) = B([H,Xα], X−α)= α(H)B(Xα, X−α)= B(H,Tα)B(Xα, X−α)= B(H,B(Xα, X−α)Tα),

quindi ogni H ∈ h e perpendicolare a [Xα, X−α]− B(Xα, X−α)Tα. Poiche B e nondegenere suh segue [Xα, X−α] = B(Xα, X−α)Tα, come volevasi dimostrare.

Si ricordi che l’algebra di Lie sl(2) ha una base H,X, Y con H = [X, Y ] e [H,X] = 2X (siveda 5.4.2). Si puo mostrare che B(Tα, Tα) 6= 0 e quindi si puo definire l’elemento

Hα :=2

B(Tα, Tα)Tα (∈ h), allora α(Hα) = B(Tα, Hα) = 2.

Page 135: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 135

Visto che CHα = CTα = [gα, g−α], ci sono Xα ∈ gα, X−α ∈ g−α tali che [Xα, X−α] = Hα epoiche α(Hα) = 2 si ha anche [Hα, Xα] = α(Hα)Xα = 2Xα. Il sottospazio tre dimensionalegenerato da Xα, X−α e Hα e allora una sottoalgebra di Lie di g isomorfa a sl(2):

[Xα, X−α] = Hα, [Hα, Xα] = 2Xα, [Hα, X−α] = −2X−α.

In particolare, ogni radice definisce una copia di sl(2).L’inclusione di algebre di Lie sl(2) → g composta con la rappresentazione aggiunta di g

definisce una rappresentazione dell’algebra sl(2) su g. In particolare, gli autovalori di ad(Hα)sono interi(!) (vedi 5.5.8). Poiche

ad(Hα)(Xβ) = [Hα, Xβ] =2

B(Tα, Tα)[Tα, Xβ] =

2β(Tα)

B(Tα, Tα)Xβ

si ha allora che2β(Tα)

B(Tα, Tα)∈ Z (∀α, β ∈ R).

Lo studio dell’azione di sl(2) su g permette inoltre di mostrare che:

dim gα = 1 se α ∈ R

e anche che se α ∈ R allora λα ∈ R se e solo se λ = ±1.

7.1.12 Lo spazio h∗R. Per ogni α ∈ R e stato definito un elemento Hα ∈ h (vedi 7.1.11).Si puo mostrare che il sottospazio vettoriale complesso di h generato dalle Hα e h. Usandol’isomorfismo h∗ ∼= h definito da B, si puo definire una forma bilineare (·, ·) su h∗ nel modoseguente:

(α, β) := B(Tα, Tβ) (∀α, β ∈ h∗).

Il sottospazio vettoriale reale di h generato dalle Hα, scritto hR, e uno spazio reale didimensione l = dimC h, il rango di g:

l = dimC h = dimR hR.

La forma bilineare (·, ·) definisce un prodotto scalare sullo spazio vettoriale reale h∗R.Si noti che in 7.1.11 abbiamo mostrato che

2(β, α)

(α, α)=

2β(Tα)

B(Tα, Tα)

e un intero.

7.1.13 Il gruppo di Weyl. L’insieme delle radici R di un’algebra di Lie complessa semplicee un sottoinsieme finito che genera uno spazio vettoriale reale h∗R con un prodotto scalare (·, ·),vedi 7.1.12.

Page 136: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 136

Per una radice α, scriviamo α⊥ per l’iperpiano perpendicolare a α:

α⊥ := x ∈ h∗R : (x, α) = 0 (⊂ h∗R).

Sia sα la riflessione in α⊥:

sα : h∗R −→ h∗R, x 7−→ x− 2(x, α)

(α, α)α,

per verificare la formula basta notare la linearita, che sα(x) = x se x ∈ α⊥, cioe se (x, α) = 0,e che sα(λα) = −λα per α ∈ R. Il sottogruppo del gruppo ortogonale di h∗R generato dalle sα,α ∈ R e il gruppo di Weyl di g, scritto

W = W (g) := 〈 sα : α ∈ R 〉 (⊂ O(h∗R)).

7.1.14 L’invarianza di R sotto W . L’insieme delle radici R e invariante per l’azione diW , cioe per w ∈ W e β ∈ R anche w(β) ∈ R. Per mostrare questo, dobbiamo verificare che seα, β ∈ R anche

sα(β) = β − 2(β, α)

(α, α)α = β − 2

B(Tβ, Tα)

B(Tα, Tα)α = β − 2

β(Tα)

B(Tα, Tα)α = β − β(Hα)α ∈ R.

La copia di sl(2) ⊂ g generata da Hα, Xα, X−α agisce su g via la rappresentazione aggiunta. Ilsottospazio V[β] ⊂ g definito da

V[β] := ⊕n∈Z gnα+β,

e una sottorappresentazione di sl(2) in g perche:

ad(Hα)Xnα+β = (nα + β)(Hα)Xnα+β, ad(X±α)Xnα+β = [X±α, Xnα+β] ∈ g(n±1)α+β.

Ogni gnα+β e uno spazio peso delle rappresentazioni di sl(2) su V[β] con peso l’intero (nα +β)(Hα) = 2n + β(Hα). Poiche ogni gnα+β ha dimensione al piu uno, segue che V[β] e unarappresentazione irriducibile di sl(2) (vedi 5.5.10). Da cio segue che i pesi di V[β] sono m,m−2, . . . ,−(m− 2),−m per un certo m ∈ Z≥0.

Dato che β(Hα) e un peso, anche −β(Hα) deve essere un peso di V[β]. Quindi esiste unintero n tale che −β(Hα) = (nα + β)(Hα). Dato che α(Hα) = 2 si ha n = −β(Hα). Percio−β(Hα)α + β e una radice di g, come desiderato.

7.1.15 Esempio: l’algebra di Cartan di sl(n). Consideriamo il caso g = sl(n). Siaαij = Li − Lj ∈ R (vedi 7.1.6), si ricordi che gαij = CEi,j. Definiamo, per i, j ∈ 1, . . . , n,i 6= j, l’elemento

Hij = [Ei,j, Ej,i] = Ei,i − Ej,j (∈ [gαij , g−αij ] ⊂ h),

la matrice diagonale con tutti i coefficienti uguale a zero tranne un 1 in posizione ii e un −1in posizione jj. In particolare, Hji = −Hij. Per esempio, se n = 3, H12 = diag(1,−1, 0) eH23 = diag(0, 1,−1). Si verifica che

[Hij, Ei,j] = 2Ei,j quindi Hij = Hαij ,

Page 137: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 137

l’unico elemento in [gαij , g−αij ] con questo autovalore su gαij .Le radici di sl(n) sono gli αkl = Lk − Ll con αkl(diag(t1, . . . , tn)) = tk − tl, quindi si ha

αkl(Hij) =

2 se k = i, l = j,1 se k = i, l 6= j,0 se k, l ∩ i, j = ∅,

e ovviamente αkl(Hlk) = −2, αkl(Hik) = αkl(−Hki) = −1 se i 6= l.L’azione del gruppo di Weyl e dato da sα(β) = β − β(Hα)α (vedi 7.1.13) quindi

sαij(αkl) =

αij − 2αij = −αij se k = i, l = j,αil − αij = αjl se k = i, l 6= j,

αkl se k, l ∩ i, j = ∅,

(si noti: αil − αij = (Li − Ll) − (Li − Lj) = Lj − Ll = αjl). Usando sα(−β) = −sα(β) esα = s−α, troviamo che

sαij(αkl) = ασ(k)σ(l), dove σ = (ij) ∈ Sn, W (sl(n)) ∼= Sn,

cioe il gruppo di Weyl del sistema di radici di sl(n) e il gruppo simmetrico Sn.Si noti che non abbiamo usato il prodotto scalare su h∗R in modo esplicito. Poiche le riflessioni

sα sono applicazioni ortogonali, possiamo comunque determinare questo prodotto scalare, ameno di moltiplicazione per una constante non-zero, da questo risultato (per calcoli ‘diretti’vedi [FH], 15.1). Anzitutto, date due radici αij, αkl, esiste un σ ∈ W (sl(n)) = Sn tale cheσ(αij) = αkl. Quindi (α, α) non dipende dalla scelta di α ∈ R. Scegliamo lo scalare col qualemoltiplichiamo il prodotto scalare su h∗R in modo tale che (α, α) = 2 e scriviamo ancora (·, ·)per questo prodotto scalare. Poiche

β(Hα) = 2(α, β)

(α, α)= (α, β)

troviamo, usando la formula per sαij qui sopra, che

(αij, αij) = 2, (αij, αil) = 1, (αij, αkl) = 0

se i, j, k, l sono distinti tra di loro. Questa mostra che si ha una isometria

h∗R = (⊕ni=1RLi) /〈L1 + . . .+ Ln〉 −→ E := (x1, . . . , xn) ∈ Rn : x1 + . . .+ xn = 0,

data da:

Li 7−→ ei− (e1 + . . .+ en)/n, quindi αij = Li−Lj 7−→ ei− ej, (αij, αkl) = (ei− ej, ek− el).

dove il prodotto scalare su E e quello indotto dal prodotto scalare euclideo standard su Rn:(x, y) =

∑xiyi. In particolare, (

∑ni=1 aiLi, Lk − Ll) = ak − al.

Page 138: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 138

7.2 Sistemi di radici e diagrammi di Dynkin

7.2.1 Sistemi di radici. Sia g un’algebra di Lie semplice (complessa) con algebra di Cartanh. La rappresentazione aggiunta di g individua un insieme finito R ⊂ h∗, cioe un insieme dimappe lineari h → C. Un α ∈ h∗ sta in R se e solo α 6= 0 e se esiste un X ∈ g tale chead(H)(X) = α(H)X per ogni H ∈ h (vedi 7.1.5). Il sottospazio reale di h∗ generato dalle radicisi scrive h∗R, la sua dimensione e uguale al rango di g, cioe l = dimC h = dimR h∗R.

La forma di Killing B su g induce un prodotto scalare sullo spazio reale h∗R, scritto sem-plicemente (·, ·). Il gruppo di Weyl W di g e il sottogruppo del gruppo ortogonale di (h∗R, (·, ·))generato dalle riflessioni rispetto agli iperpiani perpendicolari alle radici. L’insieme delle radiciR e invariante per l’azione di W , cioe ogni w ∈ W permuta le radici.

Adesso definiamo, in astratto, un sistema di radici. Mostriamo che gli insiemi di radiciR ⊂ h∗R sono sistemi di radici. Poi daremo brevemente i risultati principali che servono perclassificare i sistemi di radici e per mostrare che c’e una biiezione tra algebre di Lie complessesemplice e sistemi di radici.

7.2.2 Definizione. Sia E uno spazio vettoriale euclideo, cioe E e uno spazio vettoriale realecon prodotto scalare, scritto (·, ·). Un sistemo di radici in E e un sottoinsieme R ⊂ E tale chevalgano le seguenti quattro condizioni:

R1 R e un insieme finito, R genera E e 0 6∈ R.

R2 Sia α ∈ R, allora λα ∈ R se e solo se λ = ±1.

R3 Per α ∈ R, la riflessione sα rispetto all’iperpiano α⊥ manda R in se stesso.

R4 Per α, β ∈ R il numero reale

nβα := 2(β, α)

(α, α)

e un intero.

Un elemento di R e detto radice, il rango di R e la dimensione di E. Un sistema di radici e dettoirriducibile se R 6= R1

∐R2 in modo tale che ogni α ∈ R1 e perpendicolare con ogni β ∈ R2.

7.2.3 Un’algebra di Lie da un sistema di radici. Sia g un’algebra di Lie complessasemplice e sia h un’algebra di Cartan di g. Allora R = Rg ⊂ h∗R e un sistema di radiciirriducibile (vedi [FH], 21.1), vedi anche 7.1.11, 7.1.12.

7.2.4 Un sistema di radici da un’algebra di Lie. Sia R ⊂ E un sistema di radiciirriducibile. Si puo definire un’algebra di Lie complessa g = gR, che risulta essere semplice etale che il sistema di radici Rg di g e proprio R stessa. In piu, se R = Rg, il sistema di radicidi un’algebra di Lie complessa semplice, allora gR = g.

In combinazione con il fatto, vedi 7.2.3, che ogni algebra di Lie semplice complessa deter-mina un sistema di radici irriducibile, si conclude che si ha una biiezione tra le algebre di Lie

Page 139: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 139

semisemplici complesse e i sistemi di radici irriducibili. Per la classificazione dei sistemi diradici irriducibili, tramite diagrammi di Dynkin, si veda 7.3.

Per costruire l’algebra di Lie gR si puo usare una variante della costruzione di Serre (vedi[FH], p.337). Siano α1, . . . , αn le radici semplici di g che corrisponderanno ai vertici del dia-gramma di Dynkin, definito qui sotto e sia nij = 2(αi, αj)/(αj, αj). Si consideri l’algebra di Liecomplessa generata da elementi Hi, Xi, Yi, 1 ≤ i ≤ n, cioe un elemento di questa algebra di Liee una combinazione lineare di [Z1[Z2, [Z3, . . . Zk]] . . .] con Zj ∈ H1, . . . , Yn. Poi si prenda ilquoziente per le seguenti relazioni

[Hi, Hj] = 0, [Xi, Xi] = Hi, [Xk, Yl] = 0, [Hi, Xj] = njiXj, [Hi, Yj] = −njiYj

per ogni i, j e k 6= l, poi per i 6= j si impone anche:

[Xi, Xj] = 0, [Yi, Yj] = 0 se nij = 0,[Xi, [Xi, Xj]] = 0, [Yi, [Yi, Yj]] = 0, se nij = −1,

[Xi, [Xi, [Xi, Xj]]] = 0, [Yi[Yi, [Yi, Yj]]] = 0 se nij = −2,[Xi, [Xi, [Xi, [Xi, Xj]]]] = 0, [Yi, [Yi[Yi, [Yi, Yj]]]] = 0 se nij = −3.

L’algebra di Lie quoziente si indica con gR. Si mostra che gR e semplice, di rango n, con algebradi Cartan h =< H1, . . . , Hn > e il sistema di radici di gR e R.

7.3 Diagrammi di Dynkin

7.3.1 Radici positive e radici semplici. Le condizioni R1, . . . , R4 sono molto restrittive.Per esempio, se φ e l’angolo tra due radici α, β, allora una formula ben nota per il prodottoscalare da:

cos2 φ =(α, β)2

(α, α)(β, β)=⇒ nαβnβα = 4 cos2 φ.

Poiche gli nαβ sono interi per R4 e 0 ≤ cos2 φ ≤ 1 ci sono poche possibilita per gli nαβ (vedi[FH], Table 21.4 e 7.3.3). In particolare, non e difficile classificare tutti i sistemi di radici dirango 1 (e facile vedere che e unico) e 2 (ce ne sono 4, i tre sistemi irriducibili sono disegnatiin 7.3.3).

Per classificare i sistemi di radici in generale, si usa una qualsiasi applicazione lineare l :E → R tale che l(α) 6= 0 per ogni α ∈ R. Poiche R e finito, tale l esiste ed e detta mapparegolare. Allora, poiche l(α) 6= 0, l(−α) = −l(α) e R = −R (per R2), si ottiene una partizionedell’insieme R

R = R+∐

R− R+ := α ∈ R : l(α) > 0, R− = −R+.

L’insieme R+ e detto l’insieme delle radici positive mentre R− e l’insieme delle radici neg-ative. Una radice positiva α (∈ R+) e detta semplice se non e la somma di due altre radicipositive.

Page 140: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 140

Si mostra poi che l’insieme delle radici semplice e una base di E, che ogni radice positivae una combinazione lineare delle radici positive con coefficienti che sono interi positivi e che(α, β) ≤ 0 per radici semplici α, β. Questo implica che 90 ≤ φ < 180.

7.3.2 Esempio. Sia R il sistema di radici di sl(n), vedi 7.1.6:

R = Li − Lj : i 6= j ⊂ E = h∗R = ∑i

aiLi ∈ h∗C :∑

ai = 0, ai ∈ R ∀i .

Si scelga l : E −→ R tale che

l(∑i

aiLi) =∑

liai, con li > li+1 > 0,

allora l(Li − Lj) = li − lj 6= 0 se i 6= j, quindi l e una mappa regolare. Una scelta conveniente,anche per il sistema di radici Bn qui sotto in 7.3.5, e di definire:

l : ⊕ni=1 RLi −→ R, l(Li) = n+ 1− i, quindi l(Li − Lj) = j − i (∈ Z).

Poiche li − lj > 0 se e solo se i < j si ha:

R+ = Li − Lj : i < j . Sia αi := Li − Li+1 (∈ R+)

per i = 1, . . . , n−1. Si noti che l(α) ∈ Z>0 per ogni α ∈ R+ e l(α) = 1 se e solo se α = αi per uncerto i. Allora segue che ogni αi e semplice perche se αi = β+γ con β, γ ∈ R+ allora 1 = l(αi) =l(β) + l(γ) ≥ 2, una contraddizione. Invece, per k ≥ 2, Li−Li+k = (Li−Li+1) + (Li+1−Li+k)quindi le altre radici positive non sono semplici.

Gli αi sono una base di E (si ricordi che∑ai = 0 se

∑aiLi ∈ E). In piu, se a ∈ R+ si ha

α = Li − Lj con i < j e:

Li − Lj = (Li − Li+1) + (Li+1 − Li+2) + . . .+ (Lj−1 − Lj) = αi + αi+1 + . . .+ αj−1

quindi ogni radice positiva e combinazione lineare delle radici positive con coefficienti che sonointeri positivi (infatti, i coefficienti sono in 0, 1). Infine,

(αi, αi+1) = (Li − Li+1, Li+1 − Li+2) = −1, (αi, αj) = 0 se |i− j| > 1.

7.3.3 Diagrammi di Dynkin. Se α1, . . . , αn e α′1, . . . , α′n sono radici semplici (per scelte di

mappe regolari l, l′ : E → R), allora si mostra che esistono un w ∈ W (R) e una permutazioneσ di 1, . . . , n tale che w(αi) = α′σ(i). Quindi gli n2 prodotti scalari (αi, αj) = (α′σ(i), α

′σ(j)) sono

determinati in modo unico (a meno di permutazioni) da R.Il diagramma di Dynkin di un sistema di radici e definito nel modo seguente. Per ogni

radice semplice si ha un vertice, e due vertici sono connessi da k segmenti, k ∈ 0, 1, 2, 3, se

4(αi, αj)2

(αi, αi)(αj, αj)= 4 cos2 φ = k

Page 141: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 141

dove φ e l’angolo tra le due radici corrispondenti. Se α, β hanno lunghezza diversa, mettiamoil segno < (o >) sui segmenti tra i vertici corrispondenti, indicando in tal modo quale e piulungo dell’altro.

Se due radici semplici α e β non sono perpendicolari, (α, β) < 0. Allora k = 4 cos2 φ e 1, 2, 3,e l’angolo φ tra di loro e 120, 135, 150 rispettivamente. Si ricordi che nβα = 2(β, α)/(α, α) enβα sono interi per R4, ora negativi, con prodotto nβαnαβ = k, quindi nαβ, nβα ∈ −1,−2,−3.Supponiamo ora nαβ ≤ nβα, poiche (α, α)/(β, β) = nαβ/nβα si ha:

Se k = 1, si ha nαβ = nβα = −1, quindi (α, α) = (β, β).Se k = 2, si ha nαβ = −2, nβα = −1, quindi (α, α) = 2(β, β).Se k = 3, si ha nαβ = −3, nβα = −1, quindi (α, α) = 3(β, β).

Nel diagramma di Dynkin si trovano allora soltanto le seguenti connessioni tra due vertici:

e e e e e e> >α β α β α β

(α, α) = (β, β)cosφ = −1/2φ = 120

(α, α) = 2(β, β)

cosφ = −√

2/2φ = 135

(α, α) = 3(β, β)

cosφ = −√

3/2φ = 150

I tre casi considerati qui sopra sono tutti i tre sistemi di radici di rango 2, si chiamano A2, B2

e G2 rispettivamente. Questi sistemi di radici sono quindi i seguenti:

-

-

-

α

β

-

-

-

-

α

β

--

-

6

?

-

-

α

β

Dato il diagramma di Dynkin di R, si puo ricostruire R (a meno di moltiplicazione peruno scalare e una isometria) nel modo seguente. Si enumerino i vertici del diagramma diDynkin. Si prenda α1 = e1 ∈ E = Rn, con prodotto scalare standard. Supponiamo cheα1, . . . , αi−1 ∈ Ri−1 ⊂ Rn siano stati determinati. Dal diagramma si trova la lunghezza di αi.Si trova anche i prodotti scalari (αj, αi) (≤ 0) per j = 1, . . . , i−1, questi determinano una retta(affine) in Ri su cui giace αi. Ci sono adesso due scelte per αi (scambiate tramite la riflessionerispetto all’iperpiano Ri−1 ⊂ Ri). In questo modo si determina α1, . . . , αn ∈ Rn, unico a menodi una isometria. Sia si la riflessione rispetto all’iperpiano perpendicolare a αi e sia W il gruppogenerato dalle si. Si mostra che l’unione delle orbite delle αi e un sistema di radici, che e R, ameno di moltiplicazione per uno scalare (per aggiustare la lunghezza di α1) e una isometria:

R ∼= w(αi) : w ∈ W, i = 1, . . . , n .

7.3.4 Esempio: sl(n) e An−1. Per esempio, sia R = Li − Lj : i 6= j, 1 ≤ i, j ≤ n eαi = Li − Li+1 per i = 1, . . . , n− 1 il sistema di radici di sl(n) (con la scelta di radici positive

Page 142: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 142

come in 7.3.2). Le radici hanno la stessa lunghezza e il diagramma di Dynkin e:

c c c c c cα1 α2 α3 α4 αn−2 αn−1,

questa sistema di radici e chiamato An−1.

7.3.5 Esempio: il sistema di radici Bn. Il sistema di radici Bn e il sottoinsieme di Rn,con prodotto scalare standard, dato dai vettori α ∈ Rn con (α, α) ∈ 1, 2, cioe:

Bn = ±Li, ±(Li ± Lj), i, j ∈ 1, . . . , n, i 6= j

dove gli Li sono la base standard di Rn. Poiche le riflessioni sα sono applicazioni ortogonali, eovvio che sα(Bn) = Bn. Si noti che sα permuta Li e Lj se α = Li − Lj, manda Li 7→ −Lj eLj 7→ −Li se α = Li + Lj e manda Li 7→ −Li se α = Li. Infine sα fissa gli altri Lk.

La mappa l : Rn → R di 7.3.2 e regolare anche per Bn. Le radici positive sono gli Li e gliLi ± Lj con i < j, le radici semplici sono i α ∈ R con l(α) = 1:

α1 = L1 − L2, . . . αn−1 = Ln−1 − Ln, αn = Ln.

Il diagramma di Dynkin Bn contiene quello di An−1, poi l’ultima radice semplice αn eperpendicolare a tutte le altre tranne αn−1 e

4 cos2 φ = 4(αn−1, αn)2

(αn−1, αn−1)(αn, αn)= 4(−1)2/(2 · 1) = 2

quindi ci sono due segmenti tra αn−1 e αn. Poiche (αn−1, αn−1) > (αn, αn) mettiamo il segno‘>’ nel diagramma tra i vertice corrispondenti:

e e e e e e>α1 α2 α3 αn−2 αn−1 αn

7.3.6 Classificazione dei diagrammi di Dynkin. Si arriva cosı a classificare tutti idiagrammi di Dynkin:

Page 143: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 143

c c c c c cα1 α2 α3 α4 αn−1 αnAn, n ≥ 1, sl(n+ 1),

e e e e e e>α1 α2 α3 αn−2 αn−1 αn

Bn, n ≥ 2, so(2n+ 1),

e e e e e e<α1 α2 α3 αn−2 αn−1 αn

Cn, n ≥ 3, sp(2n),

c c c c c cc

α1 α2 α3 αn−3 αn−2

αn

αn−1Dn, n ≥ 4, so(2n),

c c c c c cc

α2 α3 α4 α5 αn−1

α1

αnEn, n = 6, 7, 8,

e e e e e e> F4,α1 α2 α3 α β

< G2.

Si noti che E5 corrisponderebbe a D5, D3 a A3, D2 a due copie di A1, e C2 a B2, mentreD1 = C1 = B1 = A1, quindi le restrizioni su n sono fatte in modo tale da avere ogni diagrammadi Dynkin una sola volta. Per i diagrammi di Dynkin delle algebre di Lie complesse semplicisl(n+ 1), so(2n) e so(2n+ 1) vedi 7.3.4, 9.4.2 e 9.5.2.

I sistemi di radici En, F4, G2 corrispondono ai ‘gruppi di Lie eccezionali’, si veda [FH] Lecture22, per maggiori dettagli su di essi. In particolare, E8 e G2 godono di un interesse particolareper i fisici.

7.3.7 Il sistema di radici duali. Sia R ⊂ E un sistema di radici. Per α ∈ R definiamo

α :=2

(α, α)α (∈ E), R := α : α ∈ R (⊂ E).

Si puo verificare che anche R ⊂ E e un sistema di radici, detto sistema di radici duali di R. Inpiu se α1, . . . , αn sono le radici semplici di R (per una scelta di una mappa regolare l), alloraα1, . . . , αn sono radici semplici di R.

Nel caso in cui (α, α) e lo stesso intero per tutti gli α ∈ R, allora ovviamente R e Rcoincidono (a meno di moltiplicazione per uno scalare). Queste e il caso per An, Dn e En. Seinvece ci sono due lunghezze di radici, potrebbe essere che R e R sono isomorfe (succede nel casoB2 = C2, F4 e G2) oppure che non sono isomorfe, questo succede soltanto nel caso R = Bn, Cncon n > 2, in quel caso Bn = Cn, e Cn = Bn per n > 2.

Nel caso di Bn, vedi 7.3.5, le radici sono

α = ±Li ⇒ α = 2Li, α = ±(Li ± Lj) ⇒ α = ±(Li ± Lj) (i 6= j).

Page 144: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 144

In particolare, (α, α) ∈ 1, 2 mentre (α, α) ∈ 2, 4. Usando la solita mappa regolare l di7.3.1, si verifica che

α1 = L1 − L2, . . . , αn−1 = Ln−1 − Ln, αn = 2Ln

sono le radici semplici e che il diagramma di Dynkin di Bn e quello di Cn. Viceversa, Cn = Bn.

7.4 Algebre di Lie semplici reali

7.4.1 Coniugazioni su uno spazio vettoriale complesso. Sia V uno spazio vettorialecomplesso di dimensione finita. Una coniugazione su V e un’involuzione C-antilineare

σ : V −→ V, σ(z1v1 + z2v2) = z1v1 + z2v2, σ(σ(v)) = v,

per v, v1, v2 ∈ V e z1, z2 ∈ C. Il sottospazio (reale) dei vettori σ-invarianti e:

V σ := v ∈ V : σ(v) = v , si ha V = V σ ⊕ iV σ,

perche la R-linearita di σ e σ2 = I da la decomposizione in autospazi (reali) V = V σ⊕V− dovev ∈ V− se σ(v) = −v. Se v ∈ V σ si ha σ(iv) = −iσ(v) = −iv, quindi iV σ ⊂ V−. Viceversa, seσ(v) = −v allora σ(−iv) = iσ(v) = −iv, quindi −iv = w ∈ V σ e v = iw ∈ iV σ, percio ancheV− ⊂ iV σ.

Un esempio di coniugazione e

σ : Cn −→ Cn, (z1, . . . , zn) 7−→ (z1, . . . , zn),

in questo caso ovviamente (Cn)σ = Rn, i vettori con z1, . . . , zn ∈ R. Ogni base di uno spazio vet-toriale complesso definisce in questo modo una coniugazione, data dalla coniugazione complessadelle coordinate di un vettore.

Se τ e un’altra coniugazione su Cn, allora τσ : Cn → Cn e C-lineare ed invertibile (si notiche (τσ)−1 = στ), quindi τ(σw) = Aw per un A ∈ GL(n,C) e ogni w ∈ V . Sia v = σ(w)allora otteniamo τ(v) = Aσ(v), quindi data una coniugazione σ, tutti le altre si ottengonocomponendo σ con un’applicazione C-lineare invertibile opportuna.

Per esempio, l’applicazione τ : C → C, z 7→ az e una coniugazione su V = C se e solo seτ 2 = I, cioe a(az) = z per ogni z ∈ C, quindi se e solo se aa = 1. Per esempio, se a = −1allora Cτ = iR.

7.4.2 Forme reali di algebre di Lie complesse. Sia g un’algebra di Lie complessa. Unaforma reale di g e un sottospazio reale g0 di g, che e un’algebra di Lie (reale) e tale cheg = g0 ⊕ ig0 (equivalente: g0 ⊗R C ∼= g tramite il prodotto X ⊗ z 7→ zX) (vedi [FH], Lecture26).

Una forma reale di g determina quindi una coniugazione σ su g con gσ = g0. In generalepero, per una coniugazione τ su g qualsiasi, lo spazio vettoriale gτ non e un’algebra di Lie.

Page 145: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

7 LA CLASSIFICAZIONE DELLE ALGEBRE DI LIE SEMISEMPLICI 145

7.4.3 Le forme reali di sl(n). L’algebra di Lie

sl(n)R := X ∈Mn(R) : tr(X) = 0 → sl(n) = Y ∈Mn(C) : tr(Y ) = 0

e una forma reale di sl(n) perche Y ∈ sl(n) si scrive in modo unico come Y = Y1 + iY2 conY1, Y2 ∈ sl(n)R (usare tr(Y1 + iY2) = tr(Y1) + itr(Y2)).

Sia Q = diag(ε1, . . . , εn) ∈ Mn(C) con εi ∈ ±1. Allora Q2 = I, cioe Q = Q−1 e Q = Q.L’applicazione X 7→ −Q−1(tX)Q e C-lineare, e quindi

τ : sl(n) −→ sl(n), X 7−→ −Q−1(tX)Q

e C-antilineare, e in piu e un’involuzione:

τ(τ(X)) = Q−1t(Q−1(tX

)Q = Q−1

(tQXQ−1

)Q = X.

I punti fissi di τ sono

su(Q) := sl(n)τ = X ∈ sl(n) : QX + tXQ = 0

che e l’algebra di Lie del gruppo unitario SU(Q) definito da

SU(Q) = A ∈ GL(n,C) : tAQA = Q, .

Se Q = Ip,q, la matrice con ε1 = . . . = εp = 1, εp+1 = . . . = εn = −1, quindi In = I, il gruppounitario si scrive SU(p, q) (oppure SU(n) se q = 0) e l’algebra di Lie si scrive su(p, q) oppuresu(n). Si puo anche mostrare in modo diretto che su(n) e una forma reale di sl(n), poicheX ∈ su(n) se e solo se X = −X e tr(X) = 0, in particolare X e una matrice antihermitiana, eogni Y ∈ sl(n) si scrive come

Y = 12

(Y − tY

)+ i−i

2

(Y + tY

), con Y − tY , −i(Y + tY ) ∈ su(n).

Il risultato fondamentale e che ogni forma reale di sl(n) e isomorfa a sl(n)R, su(n) oppuresu(p, q) con 1 ≤ p ≤ q ≤ n, p+ q = n.

7.4.4 La forma compatta. Il gruppo di Lie SU(n) e compatto. La sua algebra di Lie su(n)e una forma reale di sl(n). L’algebra di Cartan h di sl(n) da una sottoalgebra h ∩ su(n) disu(n):

h ∩ su(n) = diag(t1, . . . , tn) :∑ti = 0 ∩ X : tX = −X

= diag(is1, . . . , isn) :∑si = 0, sj ∈ R .

Gli autovalori di ad(H) per H ∈ h ∩ su(n) nella rappresentazione aggiunta sono isa − isb =i(sa − sb), in particolare, sono puramente immaginari. Poiche exp(H) = diag(et1 , . . . , etn), eex+iy = ex(cosx+ isen y), si ha che exp(h ∩ su(n)) e un sottogruppo compatto.

In generale, sia g0 una forma reale di un’algebra di Lie complessa semplice g. Allora g0

e l’algebra di Lie di un gruppo di Lie reale compatto se e solo se ogni radice di g ha valoripuramente immaginari su h ∩ g0, dove h e un’algebra di Cartan di g (vedi [FH], Proposition26.4)

Page 146: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 146

8 Rappresentazioni di algebre di Lie semplici

Testi consigliati: [FH], [Ha], [Hu].

8.1 Pesi: integralita e simmetria

8.1.1 I pesi di una rappresentazione. Sia g un’algebra di Lie semplice e sia

ρ : g −→ End(V )

una rappresentazione di g su uno spazio vettoriale complesso V di dimensione finita. Sia h ⊂ g

un’algebra di Cartan. In 7.1.3 abbiamo visto che V si decompone in spazi pesi (autospazi perh):

V = ⊕λ Vλ, ρ(H)v = λ(H)v (∀H ∈ h, v ∈ Vλ)

dove λ : h → C e un’applicazione lineare. L’insieme delle λ ∈ h∗ per i quali Vλ 6= 0 e dettol’insieme dei pesi di ρ.

In particolare, i pesi della rappresentazione aggiunta di g sono le radici e λ = 0 (vedi 7.1.5).

8.1.2 Esempio. Sia V = Cn, la rappresentazione standard di g = sl(n). Poiche H =diag(t1, . . . , tn) ∈ h e gia diagonale sulla base standard ei di V , si ha:

V = Cn = ⊕LiVLi , VLi = Cei, perche Hei = tiei = Li(H)ei.

8.1.3 Integralita dei pesi. L’algebra di Cartan h e generata su C dagli Hα dove α e unaradice di g. Dato un Hα, ci sono X±α ∈ g± tali che < Hα, Xα, X−α > e una sottoalgebra diLie di g che e isomorfa a sl(2) e tale che [Hα, X±α] = ±2X±α (vedi 7.1.11). In particolare, larestrizione della rappresentazione ρ a questa sl(2) e una rappresentazione di sl(2) e quindi gliautovalori di Hα su V sono interi. Percio, per ogni peso λ di una rappresentazione di g e perogni α ∈ R si ha:

λ(Hα) ∈ Z

Questo e equivalente a, come gia visto, < λ, α >∈ Z:

< λ, α >:= 2(λ, α)

(α, α)=

2

(α, α)B(Tλ, Tα) = B(Tλ, Hα) = λ(Hα) ∈ Z,

vedi 7.1.10 per la definizione di Tλ, 7.1.11 per la definizione di Hα e 7.1.12 per la definizione di(·, ·).

8.1.4 Il reticolo dei pesi ΛW . Quindi un peso di una rappresentazione di g e contenutonell’insieme:

ΛW := λ ∈ h∗R :< λ, α >∈ Z ∀α ∈ R .

Page 147: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 147

Scelta una decomposizione R = R+∐R−, sia ∆ = α1, . . . , αn ⊂ R+ l’insieme delle radici

semplici. I pesi fondamentali di g (rispetto a ∆) sono gli elementi λi ∈ h∗R definiti da

< λi, αi >= 1, < λi, αj >= 0 (i 6= j).

Allora si ha:ΛW = Zλ1 ⊕ Zλ2 ⊕ . . .⊕ Zλn.

Infatti, per λ ∈ ΛW sia mi =< λ, αi >. Allora mi ∈ Z e

< λ−∑i

miλi, αj >=< λ, αj > −∑i

< miλi, αj >= mj −mj = 0 (∀αj).

Dal fatto che (·, ·) e un prodotto scalare su h∗R e gli αi sono una base di h∗R, segue che λ −∑imiλi = 0, cioe:

λ =∑i

miλi, dove mi =< λ, αi >∈ Z

che mostra ‘⊂’. Per ‘⊃’, si noti che < λ, α > e lineare in λ, quindi basta verificare che< λi, α >∈ Z per i = 1, . . . , n. Si ricordi da 7.3.7 che α = (2/(α, α))α ∈ R e una radice delsistema di radici duali. Visto che < λi, α >= (λ, α) dobbiamo quindi mostrare che (λi, α) ∈ Zper ogni α ∈ R. Gli αi sono un base di radici semplici di R e quindi ogni α e una combinazionecon coefficienti interi di questi αi. Poiche (λi, α) e lineare in α basta allora verificare che(λi, αj) ∈ Z per ogni i, j. Ma (λi, αj) =< λi, αj >= δij, per definizione di λi, e abbiamomostrato ‘⊃’.

L’insieme ΛW e un sottogruppo abeliano di rango n di h∗R e genera questo spazio. Si chiamail reticolo dei pesi (weight lattice) di g.

8.1.5 Il reticolo delle radici. Il reticolo delle radici e il gruppo:

ΛR := Zα1 + . . .+ Zαn.

Poiche ogni radice e una combinazione lineare con coefficienti interi delle radici sempliciα1, . . . , αn, R ⊂ ΛR. Inoltre, dato che nβα = 2(β, α)/(α, α) =< α, β >∈ Z ogni radice eun peso e quindi ΛR ⊂ ΛW . Il gruppo quoziente ΛW/ΛR risulta essere un gruppo finito e ha(piu precisamente, il suo ‘duale’) un’interpretazione in termine di gruppi di Lie complessi conalgebra di Lie g, vedi [FH] p.372-374.

8.1.6 Radici e pesi. Nel capitolo 7 abbiamo introdotto e studiato la decomposizionedell’algebra di Lie in spazi peso per la rappresentazione aggiunta:

g = h⊕ (⊕α∈R gα).

L’azione di un ρ(Xα), con Xα ∈ gα, manda Vλ in Vλ+α,

ρ(Xα) : Vλ −→ Vλ+α (Xα ∈ gα)

Page 148: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 148

perche, per v ∈ Vλ:

ρ(H)(ρ(Xα)v) = (ρ([H,Xα]) + ρ(Xα)ρ(H))v= (ρ(α(H)Xα) + ρ(Xα)ρ(H))v= (α(H) + λ(H))(ρ(Xα)v)= (λ+ α)(H)(ρ(Xα)v).

8.1.7 Il gruppo di Weyl e i pesi. Mostriamo che per α ∈ R e λ un peso di V , anche sα(λ)e un peso di V , cioe l’insieme dei pesi di una rappresentazione e invariante per l’azione delgruppo di Weyl su h∗R. In piu dimVλ = dimVsα(λ), cioe, i pesi nella stessa orbita del gruppo diWeyl hanno la stessa molteplicita.

La dimostrazione e analoga a quella di 7.1.14. Anzitutto si ha:

sα(λ) = λ− < λ, α > α = λ− λ(Hα)α.

Se Vλ 6= 0, allora Vλ e uno spazio peso per sl(2) con peso k := λ(Hα) e molteplicita dimVλ.Sia < Hα, Xα, X−α > la copia di sl(2) ⊂ g associata a α. Il sottospazio

V[λ] := ⊕n∈Z Vλ+nα (⊂ V = ⊕λVλ)

e allora invariante per ρ(sl(2)), quindi e una rappresentazione di sl(2). Si noti che Vλ+nα e unospazio peso per Hα ∈ sl(2) con peso (λ+ nα)(Hα) = λ(Hα) + 2n perche α(Hα) = 2.

Dalla teoria delle rappresentazioni di sl(2) segue che se k e un peso di una rappresentazionedi sl(2), allora anche −k e un peso con la stessa molteplicita e che ρ(X±α)k : V[β],k → V[β],−k eun isomorfismo (con segno − se k > 0). Poiche

−k = −λ(Hα) = λ(Hα)− 2λ(Hα) = (λ− λ(Hα)α)(Hα)

il sottospazio di V[λ] con peso −λ(Hα) per sl(2) e Vλ−λ(Hα)α = Vsα(λ).

8.2 Il peso massimale di una rappresentazione irriducibile

8.2.1 La camera di Weyl. Poiche il gruppo di Weyl W permuta i pesi di ogni rappresen-tazione di g, e interessante avere un modo di determinare un unico elemento (almeno, quasisempre) in ogni orbita di W .

Sia ∆ = α1, . . . , αn ⊂ R l’insieme delle radici semplici (per una scelta di mappa regolarel). La camera di Weyl fondamentale (chiusa) e il sottoinsieme di h∗R dato da:

C = C(∆) = x ∈ h∗R : (x, α) ≥ 0 ∀α ∈ ∆ .

Allora si puo mostrare che per ogni x ∈ h∗R esiste un w ∈ W tale che w(x) ∈ C. Questo w eunico tranne se (w(x), α) = 0 per un α ∈ ∆, nel qual caso anche (sαw)(x) = w(x) ∈ C quindiw non e unico (vedi [FH], Lemma D.31). L’insieme α⊥ delle x ∈ C con (x, α) = 0 per un α ∈ ∆e detto una parete della camera di Weyl.

Page 149: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 149

8.2.2 I pesi dominanti. Un peso λ ∈ ΛW e detto dominante se λ ∈ ΛW ∩C. L’insieme deipesi dominanti e indicato con

Λ+W := ΛW ∩ C =

∑miλi : mi ∈ Z≥0

,

l’ultima ugualianza segue dal fatto che <∑miλi, αj >= mj.

8.2.3 Vettori massimali e pesi massimali. Sia ρ : g → End(V ) una rappresentazionedi g. Un peso λ di ρ e detto massimale se esiste v ∈ Vλ, v 6= 0, tale che ρ(Xα)v = 0 per ogniα ∈ R+. Il vettore v ∈ Vλ e detto vettore massimale di ρ.

Cio generalizza il concetto di vettore massimale per una rappresentazione di sl(2), vedi 5.5.5.Nel caso g = sl(2) i pesi massimali (in quel caso, interi n ∈ Z≥0) classificano le rappresentazioniirriducibili di g (vedi 5.5.10).

Ogni α ∈ R+ e una combinazione, con coefficienti interi non-negativi, di radici semplici.Poiche gα+β = [gα, gβ] se α + β e una radice, si puo mostrare che Xα e un prodotto (per ilprodotto di Lie in g) delle Xαi . Quindi ρ(Xα) e un prodotto delle ρ(Xαi). Percio un vettorev ∈ Vλ e massimale se e solo se ρ(Xαi)v = 0 per ogni radice semplice αi.

Se λ e un peso tale che Vλ+αi = 0 per ogni radice semplice, allora, poiche ρ(Xα)(Vλ) ⊂ Vλ+α,ogni v ∈ Vλ, v 6= 0, e un vettore massimale di ρ.

8.2.4 Pesi massimali sono dominanti. Mostriamo che un peso massimale e un pesodominante. Sia λ un peso massimale, e sia v ∈ Vλ un vettore massimale. Se 〈Hα, X±α〉 ⊂ g ela copia di sl(2) definita da α ∈ R+, allora il vettore massimale v e un vettore massimale perquesta sl(2). Percio ρ(Hα)v = λ(Hα)v con λ(Hα) ≥ 0. Per ogni radice semplice αi ∈ R+ si haallora 0 ≤ λ(Hαi) =< λ, αi >, quindi λ e dominante.

8.2.5 Esistenza di un vettore massimale. L’insieme dei pesi di una rappresentazione ρ dig e un insieme finito, quindi esiste un peso λ con l(λ) ≥ l(µ) per ogni peso µ di ρ. Poiche l elineare e l(α) > 0 per ogni α ∈ R+ si ha l(λ+ α) > l(λ) e quindi Vλ+α = 0 per ogni α ∈ R.

Quindi λ e un peso massimale di ρ e ogni v ∈ Vλ, v 6= 0 e un vettore massimale di ρ.

8.2.6 La rappresentazione irriducibile generata da un vettore massimale. Sia v ∈ Vλun vettore massimale. Sia W il sottospazio generato dalle immagini di v mediante successiveapplicazioni di elementi di gβ con β ∈ R−.

Mostriamo che W e una sottorappresentazione di g. Sia R− = β1, . . . , βN,

Wn := 〈 ρ(Xβi1) . . . ρ(Xβik

)v : βij ∈ R−, 0 ≤ k ≤ n 〉, W = ∪∞n=0Wn.

Poiche ρ : g → End(V ) e lineare, basta mostrare che ρ(X)x ∈ W per ogni x ∈ W e X =H,Xβ, Xα con H ∈ h, β ∈ R− e α ∈ R+.

Sia x = ρ(Xβi1) . . . ρ(Xβik

)v ∈ Wn con k ≤ n. Allora ρ(H)x = µ(H)x con µ = λ + βi1 +. . .+ βik (vedi 8.1.6), quindi ρ(H)x ∈ W e, in piu, x ∈ Vµ. In particolare,

ρ(h)Wn ⊂ Wn (∀n ∈ Z≥0),

Page 150: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 150

e segue che ρ(H)W ⊂ W per ogni H ∈ h. L’unico vettore (a meno di moltiplicazione per unoscalare) in W con peso λ e v:

Wλ = Cv,

e ogni altro peso di W si scrive come µ = λ+ βi1 + . . .+ βik con k ≥ 1 e βij ∈ R−.La definizione di Wn mostra che per x ∈ Wn e β ∈ R− si ha ρ(Xβ)x ∈ Wn+1. Segue che

ρ(Xβ)W ⊂ W per ogni β ∈ R−.In fine, mostriamo per induzione su n che

ρ(Xα)Wn ⊂ Wn ∀Xα ∈ gα, ∀α ∈ R+;

da cio segue che ρ(Xα)W ⊂ W per ogni α ∈ R+. Se n = 0, si ha W0 = Cv e ρ(Xα)v = 0 perchev e un vettore massimale. Se x ∈ Wn e n > 0, allora x = ρ(Xβ)y con y ∈ Wn−1 e β ∈ R−,quindi

ρ(Xα)x = ρ(Xα)ρ(Xβ)y= ρ(Xβ)ρ(Xα)y + ρ([Xα, Xβ])y.

Si noti che Y := [Xα, Xβ] ∈ gα+β. Se α + β 6∈ R ∪ 0, gα+β = 0 e quindi Y = 0. Seα + β = 0, Y ∈ h e quindi ρ(Y )y ∈ Wn. Se α + β ∈ R− allora ρ(Y )y ∈ Wn perche y ∈ Wn−1.Se α + β ∈ R+ si ha ρ(Y )y ∈ Wn−1 per l’ipotesi di induzione. Quindi in ogni caso si haρ([Xα, Xβ])y ∈ Wn. Sempre per l’ipotesi di induzione, per y ∈ Wn−1 si ha ρ(Xα)y ∈ Wn−1, epercio ρ(Xβ)ρ(Xα)y ∈ Wn. Allora anche ρ(Xβ)ρ(Xα)y+ ρ([Xα, Xβ])y ∈ Wn e concludiamo cheρ(Xα)x ∈ Wn.

8.2.7 La rappresentazione W e irriducibile. Mostriamo che la rappresentazione W dig generata dal vettore massimale v e irriducibile. Sia W = W ′ ⊕ W ′′, dove W ′,W ′′ sonosottorappresentazioni. Decomponendo ciascuna in spazi peso, lo spazio peso Wλ = Cv, che hadimensione uno, e contenuto in W ′ oppure W ′′. Poiche la rappresentazione di g generata da ve W si ha W ′ = W oppure W ′′ = W , quindi W e irriducibile.

8.2.8 Il vettore massimale e unico. Mostriamo che v e l’unico vettore massimale (a menodi moltiplicazione per uno scalare) nella rappresentazione W . Sia v′ ∈ W , v′(6= 0) un vettoremassimale. Allora v′ genera una sottorappresentazione W ′ ⊂ W . Dato che W e irriducibile eW ′ 6= 0, si ha allora W ′ = W . Sia µ ∈ ΛW il peso di v′, allora µ = λ+ βi1 + . . .+ βik per certiβir ∈ R−. Sia l : h∗R → R una mappa regolare lineare tale che l(β) < 0 per ogni β ∈ R−, alloral(µ) ≤ l(λ) e si ha l(µ) = l(λ) se e solo se µ = λ.

Ogni altro peso di W ′ si scrive come τ = µ+βj1 + . . .+βjl per certi βjs ∈ R−, in particolarel(τ) ≤ l(µ). Dato che v ∈ W ′ e il peso di v e λ segue allora che l(λ) ≤ l(µ).

Quindi l(µ) = l(λ) e percio µ = λ. Dato che Wλ = Cv, segue v′ ∈ Cv. In particolare, unarappresentazione irriducibile ha un unico vettore massimale, a meno di moltiplicazione per unoscalare.

8.2.9 Conclusione. Data una rappresentazione ρ : g → End(V ), il teorema di Weyl (vedi5.4.6) afferma che V = V1 ⊕ V2 ⊕ . . . ⊕ Vk, dove ogni Vi e una rappresentazione irriducibile.I risultati appena ottenuti mostrano che ogni Vi ha un vettore massimale vi e che il vettore

Page 151: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 151

massimale vi genera una sottorappresentazione irriducibile di Vi, che e quindi Vi. In particolare,la dimensione dello spazio generato dai vettori massimali e k.

Se la rappresentazione ρ e irriducibile, allora ha un unico vettore massimale (a meno dimoltiplicazione per uno scalare). Il peso λ = λρ del vettore massimale e allora determinatoin modo unico dalla rappresentazione. Questo peso λ e massimale (per definizione) e abbiamomostrato che e quindi dominante (si veda 8.2.4).

Mostriamo che il peso λ determina in modo unico (a meno di isomorfismi) la rappresen-tazione irriducibile W generata dal vettore massimale. Questa rappresentazione irriducibileverra indicata con V (λ).

Poi c’e da stabilire se un peso dominante λ determini una rappresentazione irriducibile ilcui vettore massimale abbia peso λ (si vedano 8.2.12 e 8.2.13).

8.2.10 Unicita della rappresentazione irriducibile. Due rappresentazioni irriducibiliρV , ρW di g su spazi vettoriali V,W rispettivamente, con vettori massimali v ∈ V e w ∈ W elo stesso peso λ ∈ Λ+

W sono isomorfe. Per vedere questo, si consideri la somma diretta V ⊕W ,che e una rappresentazione di g con

ρ : g −→ End(V ⊕W ), ρ(X)(x, y) := (ρV (X)x, ρW (X)y).

Sia U ⊂ V ⊕ W la sottorappresentazione generata da (v, w). Allora U e irriducibile perche(v, w) e un vettore massimale in V ⊕W . La proiezione

πV : U −→ V, (x, y) 7−→ x, soddisfa πV ρ(X) = ρV (X)πV

per ogni X ∈ g come si verifica facilmente. Quindi πV e un omomorfismo di rappresentazioni epercio ker(πV ) e im(πV ) sono sottospazi invarianti (vedi 5.3.3). Poiche (v, w) ∈ U e πV (v, w) =v ∈ V , si ha ker(πV ) 6= U e im(πV ) 6= 0. Dato che U e V sono irriducibili, si ha alloraker(πV ) = 0 e im(πV ) = V , quindi πV e un isomorfismo. Similmente, usando πW , si trova cheU ∼= W , quindi V ∼= W .

8.2.11 Prodotti tensoriali e pesi. Il prodotto tensoriale di rappresentazioni ρV , ρW diun’algebra di Lie g e definito da

ρV⊗W (X)(v ⊗ w) = (ρ(X)v)⊗ w + v ⊗ (ρW (X)w).

In particolare, se X = H ∈ g e

ρV (H)v = µ1(H)v, ρW (H)w = µ2(H)w =⇒ ρV⊗W (H)(v ⊗ w) = (µ1 + µ2)(H)(v ⊗ w).

Quindi se Vµ1 e Wµ2 sono spazi peso di V e W , il loro prodotto tensoriale e contenuto in unospazio peso di V ⊗W :

Vµ1 ⊗Wµ2 ⊂ (V ⊗W )µ1+µ2 .

In generale si ha Vµ1 ⊗ . . .⊗ Vµk ⊂ Vµ1+...+µk .

8.2.12 Le rappresentazioni irriducibili fondamentali. I pesi fondamentali λ1, . . . , λn,definiti da < λi, αj >= δij (vedi 8.1.4), sono in particolare pesi dominanti (vedi 8.2.2). Un

Page 152: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 152

teorema fondamentale mostra che esistono rappresentazioni irriducibili V (λi) di g con pesomassimale λi , cioe

ρi : g −→ End(V (λi)), ρi(H)vi = λi(H)vi, ρi(Xα)vi = 0,

per ogni α ∈ R+, dove vi ∈ V (λi) e un vettore massimale (che e unico a meno di moltiplicazioneper una costante). Queste rappresentazioni si chiamano rappresentazioni fondamentali di g.

8.2.13 La classificazione di rappresentazioni irriducibili. Ogni peso dominante λ e unacombinazione lineare con coefficienti interi non-negativi dei pesi fondamentali. Sia λ =

∑imiλi,

mi ∈ Z≥0. Consideriamo il prodotto tensoriale

V := V (λ1)⊗ . . .⊗ V (λ1)︸ ︷︷ ︸m1

⊗V (λ2)⊗ . . .⊗ V (λ2)︸ ︷︷ ︸m2

⊗ . . .⊗ V (λn)⊗ . . .⊗ V (λn)︸ ︷︷ ︸mn

.

Sia vi ∈ V (λi) un vettore massimale e sia

v := v1 ⊗ . . .⊗ v1︸ ︷︷ ︸m1

⊗ v2 ⊗ . . .⊗ v2︸ ︷︷ ︸m2

⊗ . . .⊗ vn ⊗ . . .⊗ vn︸ ︷︷ ︸mn

(∈ V ).

Dato che vi ∈ V (λi) e un vettore massimale, cioe ρi(Xα)vi = 0 per ogni αi ∈ R+, si ha

ρ(Xα)v = ρ1(Xα)v1 ⊗ v1 . . .⊗ vn + . . .+ v1 ⊗ v1 . . .⊗ ρn(Xα)vn = 0 + . . .+ 0 = 0.

Quindi v e un vettore massimale in V con peso (massimale e quindi dominante):

ρ(H)v = (m1λ1 +m2λ2 + . . .+mnλn)(H)v = λ(H)v.

Percio v genera una rappresentazione irriducibile W ⊂ V con (unico) peso massimale λ (vedi8.2.6). Questa rappresentazione W e l’unica rappresentazione irriducibile con peso massimaleλ (vedi 8.2.10) ed e indicata con V (λ) := W .

In questo modo si conclude la classificazione delle rappresentazioni irriducibili di un’al-gebra di Lie complessa semplice: esse corrispondono ai pesi dominanti. In particolare sonoparametrizate da n-tuple di interi (m1, . . . ,mn) dove n e il rango dell’algebra di Lie, e ognimi ∈ Z≥0. La rappresentazione corrispondente e V (λ) con λ =

∑miλi.

8.2.14 Formula per la dimensione di V (λ). La dimensione della rappresentazione V (λ)corrispondente al peso dominante λ e ([FH], Cor. 24.6):

dimV (λ) =

∏α∈R+ (λ+ δ, α)∏α∈R+ (δ, α)

, dove δ = 12

∑α∈R+

α.

Un esempio: se g = sl(3), si ha R+ = L1 − L2, L2 − L3, L1 − L3 e quindi

δ = L1 − L3,∏α∈R+

(δ, α) = 1 · 1 · 2 = 2.

Page 153: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 153

Se λ = m1λ1 +m2λ2 = a1L1 + a2L2, con a1 = m1 +m2, m2 = a2, allora∏α∈R+

(λ+ δ, α) = (m1 + 1)(m2 + 1)(m1 +m2 + 2) = (a1 − a2 + 1)(a2 + 1)(a1 + 2),

quindi la dimensione di V (λ) e:

dimV (m1λ1 +m2λ2) = (m1 + 1)(m2 + 1)(m1 +m2 + 2)/2 = (a1 − a2 + 1)(a2 + 1)(a1 + 2)/2.

8.3 Le rappresentazioni irriducibili di sl(n)

8.3.1 I pesi fondamentali di sl(n). Un insieme di radici semplici del sistema di radici R disl(n), indicato con An−1, e dato dalle αi = Li − Li+1 ∈ Rn/〈L1 + . . .+ Ln〉, con 1 ≤ i ≤ n− 1.Si noti che, con

λ1 = L1, λ2 = L1 +L2, . . . , λn−1 = L1 +L2 + . . .+Ln−1 = −Ln si ha < λi, αj >= δij,

dove il prodotto scalare (·, ·) viene calcolato tramite l’isometria di h∗R con E in 7.1.15. Inparticolare, (α, α) = 2 per ogni radice α e percio < λ, α >= (λ, α). Quindi questi λi sono i pesifondamentali.

I pesi dominanti di sl(n) sono allora

Λ+W =

∑n−1i=1 miλi : mi ∈ Z≥0

= (m1 + . . .+mn−1)L1 + (m2 + . . .+mn−1)L2 + . . .+mn−1Ln−1 : mi ∈ Z≥0

cioe un peso∑n−1

i=0 aiLi e dominante se a1 ≥ a2 . . . ≥ an−1 (e poi an−1 = mn−1, an−2 − an−1 =mn−2 ecc.).

Nella rappresentazione standard Cn di sl(n), l’algebra di Cartan e data dalle H =diag(t1, . . . , tn) con

∑ti = 0 e Li(H) = ti. In particolare si ha la decomposizione in spazi

peso:Cn = ⊕ni=1 Cei, Hei = Li(H)ei (1 ≤ i ≤ n)

e ei e l’i-esimo vettore della base standard di Cn. L’unico peso dominante in L1, . . . , Ln eL1 = λ1 quindi si ha:

V (λ1) = Cn.

Si noti anche che Xα, per α ∈ R+, e una matrice triangolare superiore con zeri sulla diagonale,quindi Xαe1 = 0, che verifica che e1 ∈ (Cn)λ1 e un vettore massimale.

La rappresentazione di sl(n) su ∧kCn (⊂ (Cn)⊗k), per k < n, ha la seguente decomposizionein spazi peso:

∧kCn = ⊕(∧kCn)λ, λ = Li1 + Li2 + . . .+ Lik , Vλ = C ei1 ∧ ei2 ∧ . . . ∧ eik ,

dove i1 < . . . < ik. L’unico peso dominante tra le Li1 + Li2 + . . . + Lik , con indici distinti, eL1 +L2 + . . .+Lk = λk (bisogna ricordare Ln = −(L1 + . . .+Ln−1)). Quindi la rappresentazione

Page 154: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 154

e irriducibile perche ogni sottorappresentazione non banale avrebbe un peso dominante. Percioabbiamo trovato le rappresentazioni irriducibili fondamentali, esse sono i

V (λk) = ∧kCn.

Il prodotto wedge

∧kCn × ∧n−kCn −→ ∧nCn ∼= C, (ω, θ) 7−→ ω ∧ θ = cω,θe1 ∧ . . . ∧ en

da una dualita ∧kCn ∼= (∧n−kCn)∗. Quindi le rappresentazioni V (λk) e V (λn−k) di sl(n) sonorappresentazioni duali:

V (λk) ∼= (V (λn−k))∗.

8.3.2 Rappresentazioni di sl(n) e funtori di Schur. La rappresentazione Vλ, con λ =∑miλi, e una sottorappresentazione di un prodotto tensoriale:

V (λ) → ⊗k(∧kV )⊗mk ⊂ V ⊗∑n−1k=1 kmk , V = Cn.

La decomposizione del prodotto tensoriale V ⊗m in rappresentazioni irriducibili di GL(V )e data nel Teorema 3.2.6. Mostriamo che la restrizione a SL(V ) di una rappresentazioneirriducibile ρ di GL(V ) su uno spazio vettoriale W rimane irriducibile. Ogni A ∈ GL(V )si scrive come A = (tI)B con t = ( n

√det(A))−1, n = dimV , e B ∈ SL(V ). Poiche tI

commuta con tutti gli elementi di GL(V ), anche ρ(tI) commuta con tutto ρ(GL(V )), e quindi,per il Lemma di Schur 2.1.7, ρ(tI) = sIW per un s = s(t) ∈ C. Se W = W1 ⊕ W2 e unadecomposizione di W in sottospazi invarianti per ρ(SL(V )), allora, poiche sIW (Wi) ⊂ Wi,questi sottospazi sono invarianti anche per ρ(GL(V )), quindi uno dei due e 0 e l’altro W .Segue che ρ : SL(V )→ GL(W ) e irriducibile.

In particolare, nella decomposizione del Teorema 3.2.6:

TmV = ⊕p(SpV )mp , con p = (p1, . . . , pr), pi ≥ pi−1 > 0,∑i

pi = m

in rappresentazioni irriducibili per GL(V ), parametrizzate dalle partizioni p di m, ogni SpV euna rappresentazione irriducibile di SL(V ) = SL(n,C) e quindi di sl(n). Il peso dominanteche corrisponde alla rappresentazione irriducibile di SpV e:

SpV ∼= V (p1L1 + p2L2 + . . .+ prLr).

Poiche L1 + . . . + Ln−1 + Ln = 0, le rappresentazioni definite da p = (p1, . . . , pr) e pa =(p1 + a, . . . , pr + a, a, . . . , a), partizioni di m e m+ na rispettivamente, sono isomorfe.

Per mostrare che SpV ∼= V (p1L1 + p2L2 + . . . + prLr), basta trovare un peso massimale inSpV , che e unico perche SpV e irriducibile, e verificare che e uguale a p1L1 + p2L2 + . . .+ prLr.Si ricordi che SpV = apbpT

mV e

bpV⊗m ⊂ (∧µ1V )⊗ . . .⊗ (∧µsV ),

Page 155: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 155

dove µi e il numero dei quadrati nella i-esima colonna del diagramma di Young di p (vedi3.2.11). In particolare, s = p1, il numero delle colonne e uguale al numero dei quadrati nellaprima riga. Un vettore massimale del lato a destra e

v = (e1 ∧ e2 ∧ . . . ∧ eµ1)⊗ . . .⊗ (e1 ∧ e2 ∧ . . . ∧ eµs), Hv = (p1L1 + . . .+ prLr)(H)v,

perche Hei = Li(H)ei e e1 compare s = p1 volte in v e ha peso L1, poi ci sono p2 colonnecon almeno due quadrati e percio e2 compare p2 volte, ecc. Il vettore v e massimale perche unXα, per α ∈ R+ e dato da un Ei,j, con i < j, che manda ej 7→ ei e ek 7→ 0 se k 6= j, quindiv 7→ 0. Applicando ap a v otteniamo un vettore di SpV e poiche apv e una simmetrizzazioneparziale di v il peso di apv ∈ SpV e uguale al peso di v. Da cio segue l’isomorfismo SpV ∼=V (p1L1 + p2L2 + . . .+ prLr).

Nel caso n = 3 verifichiamo esplicitamente che la dimensione di S(a1,a2)V , calcolato usando3.2.10 e uguale alla dimensione di V (a1L1 +a2L2), calcolata con 8.2.14. Il diagramma di Youngdella partizione m = a1 + a2 e:

. . .

. . .

. . .

a1+1 a1

a2 a2−1

a1−a2+2

a1−a2

1

. . .

. . . ,2 1

dove abbiamo indicato gli hooklength hij nei quadrati. Allora si ha, per n = 3,

dimS(a1,a2)V =∏i,j

n− i+ j

hij=

(a1∏j=1

(2 + j)

)(a2∏j=1

(1 + j)

)a1 − a2 + 1

(a1 + 1)! a2!

quindi dimS(a1,a2)V = (a1 + 2)(a2 + 1)(a1 − a2 + 1)/2 che e proprio la formula di 8.2.14 perdimV (a1L1 + a2L2).

8.3.3 Il prodotto simmetrico della rappresentazione standard. Mostriamo che larappresentazione V (kλ1) (per k ≥ 0) di sl(n) e la rappresentazione SkV (λ1), il k-esimo prodottosimmetrico della rappresentazione standard V = V (λ1). In piu determiniamo gli spazi peso emostriamo che ogni spazio peso ha dimensione 1.

Consideriamo (si veda anche 5.3.4 per il caso n = 2) la rappresentazione del gruppo di LieSL(n,R) su C∞(Rn) definita da:

r : SL(n,R) −→ Aut(C∞(Rn)), (r (A)F )(v) := F (tAv) (v ∈ Rn).

Sia ρ := (dr)I : sl(n,R) → End(C∞(Rn)) la rappresentazione dell’algebra di Lie associata. Simostra facilmente che, per i 6= j,

ρ(Ei,j) = xi∂

∂xj, ρ(t1E1,1 + . . .+ tnEn,n) = t1x1

∂x1

+ . . .+ tnxn∂

∂xn.

Sia C[x1, . . . , xn]m lo spazio vettoriale dei polinomi omogenei di grado m. Una base diC[x1, . . . , xn]m e data dai monomi

xa11 x

a22 . . . xann , a1 + a2 + . . .+ an = m.

Page 156: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

8 RAPPRESENTAZIONI DI ALGEBRE DI LIE SEMPLICI 156

E’ facile verificare che C[x1, . . . , xn]m e un sottospazio sl(n,R)-invariante che e anche sl(n) =sl(n,R)⊗R C invariante. La complessificazione di ρ da allora le rappresentazioni

ρm : sl(n) −→ End(C[x1, . . . , xn]m).

Un vettore massimale di ρm e un F ∈ C[x1, . . . , xn]m tale che ρm(Xα)F = 0 per ogni α ∈ R+.Allora α = Li − Lj con i < j, ρm(Xα) = xi∂/∂xj e F soddisfa:

xi∂F

∂xj= 0 1 ≤ i < j ≤ n.

In particolare, ∂F/∂xj = 0 per j = 2, . . . , n quindi F = cxm1 per uno scalare c ∈ C. Quindiρm ha un unico vettore massimale (a meno di moltiplicazione per uno scalare) e percio ρm eirriducibile. Il peso del vettore massimale e:

ρm(H)(xm1 ) = (t1x1∂

∂x1

+ . . .+ tnxn∂

∂xn)(xm1 ) = mt1 x

m1 = mL1(H)xm1 ,

quindi il peso massimale e mL1. Dato che λ1 = L1, questo mostra che

V (mλ1) ∼= C[x1, . . . , xn]m = SmV,

detto l’m-esimo prodotto simmetrico della rappresentazione standard V . Si verifica che ognimonomio e un vettore peso:

ρm(H)(xa11 x

a22 . . . xann ) = (a1L1 + a2L2 + . . .+ anLn)(H)xa1

1 xa22 . . . xann .

I pesi sono quindi della forma a1L1 +a2L2 + . . .+anLn con ai ≥ 0 e∑ai = m. Questi pesi sono

distinti tra di loro, percio ogni spazio peso ha dimensione uno cioe ogni peso ha moltiplicitauno.

Page 157: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 157

9 Gruppi ortogonali

Testi consigliati: [FH].

9.1 Forme bilineari simmetriche e forme quadratiche

9.1.1 Forme bilineari simmetriche. Sia V uno spazio vettoriale su un campo K (K = Roppure C) di dimensione n. Sia

B : V × V −→ K

una forma bilineare simmetrica. Sia ei una base di V , allora B e definita da una matricesimmetrica

A := (B(ei, ej))1≤i,j≤n = tA, B(x, y) = txAy.

Per S ∈ GL(n,K) si ha alloraB(Sx, Sy) = tx(tSAS)y.

Due matrici simmetriche A,A′ sono dette congruenti se A = tSAS per un S ∈ GL(n,K). Unaforma bilineare simmetrica ψ definisce quindi una classe di congruenza di matrici simmetriche.

Data una matrice simmetrica A, esiste una matrice S ∈ GL(n,K) tale che

tSAS = diag(1, . . . , 1︸ ︷︷ ︸p

,−1, . . . ,−1︸ ︷︷ ︸q

, 0, . . . , 0︸ ︷︷ ︸r

), p+ q + r = n = dimV.

(si veda [A], 7.2, Teorema 2.9). Nel caso K = C si puo sempre trovare una S tale che q = 0 (seB(x, x) = −1 allora B(ix, ix) = i2B(x, x) = +1).

9.1.2 Legge di Sylvester. ([A], Capitolo 7, Teorema 2.11) I numeri p, q, r che compaiononella matrice diagonale qui sopra sono determinati univocamente dalla classe di congruenza diA, cioe dalla forma bilineare B.

9.1.3 Forme bilineari simmetriche nondegeneri. Una forma bilineare B e detta nonde-genere se per ogni v ∈ V , v 6= 0, esiste un w ∈ V tale che B(v, w) 6= 0. Equivalentemente, seA e una matrice simmetrica che definisce B, allora detA 6= 0, oppure nella forma standard diA qui sopra si ha r = 0.

Una forma bilineare simmetrica nondegenere e quindi determinata, a meno di isomorfismidi V , da due interi non-negativi p, q con p + q = n e la matrice simmetrica in forma standardcorrispondente e indicata con:

Ip,q := diag(1, . . . , 1︸ ︷︷ ︸p

,−1, . . . ,−1︸ ︷︷ ︸q

), p+ q = n.

9.1.4 Forme quadratiche. Una forma quadratica Q su V e un’applicazione

Q : V −→ K, tale che Q(x) = B(x, x)

Page 158: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 158

per una certa forma bilineare simmetrica B. Si noti che, rispetto ad una base dove B e datadalla matrice simmetrica A, si ha:

Q(x+ y) = t(x+ y)A(x+ y) = txAx+ txAy + tyAx+ tyAy = Q(x) +Q(y) + 2B(x, y),

dove txAy = B(x, y) = B(y, x) = tyAx, quindi Q determina B in modo unico: B(x, y) =(Q(x+ y)−Q(x)−Q(y))/2. (Equivalentemente, si definisce una forma quadratica richiedendoche (x, y) 7→ Q(x+y)−Q(x)−Q(y) sia un’applicazione bilineare). Si dice che Q e nondegenerese B lo e.

Siano K = R e Q nondegenere. Allora esiste una base di V e ci sono p, q con p+ q = n taliche

Q(x) = txIp,qx = x21 + . . .+ x2

p − (x2p+1 + . . .+ x2

n).

Nel caso K = C e Q nondegenere, esiste una base tale che

Q(x) = txIn,0x = x21 + . . .+ x2

n.

In questo caso conviene spesso scegliere un’altra base di V . Nel caso n = 2m quella per cui lecoordinate sono:

yj = xj + ixm+j, yj+m = xj − ixm+j, quindi Q(x) =m∑j=1

(x2j + x2

j+m) =m∑j=1

yjyj+m,

nel caso n = 2m+ 1 dispari, si prende y2m+1 = x2m+1 quindi Q(x) = (∑m

j=1 yjyj+m) + y22m+1.

Il gruppo ortogonale O(Q) di una forma quadratica e il sottogruppo di GL(V ) definito da

O(Q) = S ∈ GL(V ) : Q(Sx) = Q(x) = S ∈ GL(V ) : B(Sx, Sy) = B(x, y) ∀x, y ∈ V ,

l’ultima ugualianza segue da 2B(x, y) = Q(x+ y)−Q(x)−Q(y).Nel caso K = R i gruppi ortogonali sono indicati con

O(p, q) := O(Ip,q), O(n,R) := O(In,0)

dove si scrive il campo R in modo esplicito per non confondersi con

O(n) = O(In) = O(n,C)

per il gruppo ortogonale complesso. Visto che il gruppo ortogonale O(p, q) e isomorfo a O(q, p)(basta moltiplicare la matrice Ip,q con −1 e permutare i vettori di base), consideriamo soltantoil caso p ≥ q nella sezione seguente.

9.1.5 Componenti connesse dei gruppi ortogonali. I gruppi ortogonali O(n,R) e O(n)hanno due componenti connesse, la componente connessa contenente l’identita I e SO(n,R)rispettivamente SO(n). I gruppi O(p, q) con pq 6= 0 hanno quattro compomenti connesse.

Mostriamo che O(p, q) ha almeno 4 componenti connesse. Scriviamo una matrice M ∈O(p, q) nel modo seguente

M =

(A BC D

), A ∈Mp(R), B ∈Mp,q(R), C ∈Mq,p(R), D ∈Mq(R).

Page 159: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 159

Allora A e invertibile: se Ax = 0 per x ∈ Rp allora(A BC D

)(x0

)=

(0y

), y = Cx ∈ Rq,

e quindi Qp,q((x, 0)) =∑x2i ≥ 0 e Qp,q(M(x, 0)) = Q((0, y)) = −

∑y2j ≤ 0. Poiche M ∈

O(p, q) si ha x = y = 0 e quindi A e invertibile. In particolare, l’applicazione

δ : O(p, q) −→ R− 0, M 7−→ det(A)

e ben definita e continua. Adesso consideriamo l’applicazione continua:

(det, δ) : O(p, q) −→ (R− 0)2, M 7−→ (det(M), δ(M)).

Sia M la matrice diagonale con M11 = b, Mnn = ab e Mii = 1 per i 6= 1, n. Allora pera, b ∈ ±1 si ha M ∈ O(p, q) e (det(M), δ(M)) = (ab2, b) = (a, b). Poiche (R − 0)2 haquattro componenti connesse, concludiamo che anche O(p, q) ha almeno quattro componenticonnesse.

9.2 Esempi di gruppi ortogonali

9.2.1 Il gruppo ortogonale O(2,R). Il gruppo O(2,R) e il sottogruppo delle matriciortogonali di GL(2,R). Si ha A ∈ O(2,R) ⇔ tAA = I che da le condizioni seguenti suicoefficienti di A: (

a cb d

)(a bc d

)=

(a2 + c2 ab+ cdab+ cd b2 + d2

)=

(1 00 1

).

Poiche ab + cd = 0 e (a, c), (b, d) 6= (0, 0) esiste un λ ∈ R, λ 6= 0, tale che (b, d) = (−λc, λa).L’equazione 1 = b2 + d2 = λ2(a2 + c2) = λ2 mostra che λ = ±1.

Nel caso λ = 1, si ha (b, d) = (−c, a). Poiche a2 + c2 = 1, il punto (a, c) ∈ R2 sta sullacirconferenza con raggio 1 e quindi esiste un φ ∈ R tale che a = d = cosφ, c = −b = senφ equindi

Aφ =

(cosφ −senφsenφ cosφ

), AφAψ = Aφ+ψ

che e la matrice di una rotazione per φ con centro (0, 0). Si noti che detA = 1. Per verificareche AφAψ = Aφ+ψ, cioe che φ 7→ Aφ e un omomorfismo di gruppi di Lie R→ SO(2,R), si usanole ben note formule che seguono da eiφeiψ = ei(φ+ψ), cioe

(cosφ+ isenφ)(cosψ + isenψ) = cos(φ+ ψ) + isen (φ+ ψ).

Si noti che Aφ = exp(φX) dove X e un generatore di Lie(SO(2,R)), si veda 5.2.8.Nel caso λ = −1 si ha (b, d) = (c,−a) e detA = a(−a) − b2 = −(a2 + b2) = −1. Segue

che O(2,R) ha due componenti connesse, ciascuna omeomorfa alla circonferenza S1. Come

Page 160: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 160

prima, si ha (a, c) = (cosφ, senφ). Sia ψ = φ/2, allora (si usi per esempio (eiψ)2 = e2iψ cioe(cosψ + isenψ)2 = cos 2ψ + isen 2ψ):

a = −d = cosφ = cos 2ψ = cos2 ψ − sen 2ψ, b = c = senφ = sen 2ψ = 2 cosψsenψ.

Si verifica che A e la matrice della riflessione rispetto all’iperpiano v⊥ definito da v =(−senψ, cosψ), cioe Ax = x− 2(x, v)v.

Il prodotto di due riflessioni e in SO(2,R) e quindi e una rotazione. Ogni rotazione e ilprodotto di due riflessioni, per esempio, A,B qui sotto sono riflessioni e

A =

(cosφ senφsenφ − cosφ

), B =

(1 00 −1

), AB =

(cosφ −senφsenφ cosφ

)e la rotazione per φ.

9.2.2 Il gruppo di Lorentz O(1, 1). Il gruppo O(1, 1) e il sottogruppo delle matrici diGL(2,R) che soddisfano tAI1,1A = I1,1, cioe:(

a cb d

)(1 00 −1

)(a bc d

)=

(a2 − c2 ab− cdab− cd b2 − d2

)=

(1 00 −1

).

Poiche ab − cd = 0 esiste un λ ∈ R tale che (b, d) = (λc, λa), L’equazione 1 = b2 − d2 =λ2(a2 − c2) = λ2 mostra che λ = ±1.

Per parametrizzare le soluzioni dell’equazione a2 − c2 = 1, poniamo u = a + c. Poiche(a + c)(a − c) = 1, si ha u−1 = a − c, in particolare u 6= 0, cioe u ∈ R>0 oppure u ∈ R<0.Dunque

a = (u+ u−1)/2, c = (u− u−1)/2, con u = a+ c, u−1 = a− c.

Si noti che O(1, 1) ha quattro componenti connesse, in corrispondenza con il segno di λ e diu = a + b, ciascuno di queste componenti e omeomorfa con R>0. Poiche detA = ad − bc =a(λa)− (λc)c = λ(a2 − c2) = λ, la componente connessa di O(1, 1) che contiene l’identita I e:

SO(1, 1)o =

(a bc d

)=

((u+ u−1)/2 (u− u−1)/2(u− u−1)/2 (u+ u−1)/2

): u ∈ R>0

.

Ci sono altre due parametrizzazioni di SO(1, 1)o che sono ben note. Una viene dalla teoriadella relativita speciale. Poiche u ∈ R>0, l’applicazione u 7→ u2 e una biiezione. Si definisce

v =u2 − 1

u2 + 1, con inversa: u2 =

1 + v

1− v, u =

√1 + v√1− v

=1 + v√1− v2

.

Quindi i coefficienti delle matrici sono

a = (u+ u−1)/2 = (

√1 + v√1− v

+1

2

√1− v√1 + v

) =1√

1− v2, b = (u− u−1)/2 =

v√1− v2

.

Page 161: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 161

Gli elementi di O(1, 1)o sono quindi le ben note trasformazioni di Lorentz (con velocita dellaluce c = 1, quindi v = v/c = β):

Av :=

(1√

1−v2v√

1−v2v√

1−v21√

1−v2

), si verifica AvAw = A v+w

1+vw,

e v+w1+vw

e la somma ‘relativistica’ delle velocita.Un’altra parametrizzazione e data dalla mappa esponenziale (si veda 5.2.7 exp :

T0SO(1, 1)o = R → SO(1, 1)o. Poiche SO(1, 1)o e uno dimensionale e u 7→ γ(u), con γ(u)la matrice con a = (u+ u−1)/2 ecc., e un cammino con γ(1) = I, e X := γ′(1) e dato da

X =d

du

((u+ u−1)/2 (u− u−1)/2(u− u−1)/2 (u+ u−1)/2

)|u=1

=

(0 11 0

), Lie(SO(1, 1)o) = RX

Per calcolare exp(tX) si noti che X2 = I e quindi

exp(tX) =

(∞∑k=0

t2k

(2k)!

)I +

(∞∑k=0

t2k+1

(2k + 1)!

)X =

((et + e−t)/2 (et − e−t)/2(et − e−t)/2 (et + e−t)/2

).

Poiche exp(tX)exp(sX) = exp((s + t)X), otteniamo un isomorfismo exp : R → SO(1, 1)o,t 7→ exp(tX) (suriettivo perche per ogni u ∈ R>0 esiste un t ∈ R tale u = et e iniettivo perche(et + e−t)/2 = 1 se e solo se t = 0). Spesso si usa la notazione:

cosh t := (et + e−t)/2, sinh t := (et − e−t)/2.

9.2.3 Il gruppo O(2, 1). Consideriamo lo spazio vettoriale V delle matrici 2× 2 con tracciazero, che e anche l’algebra di Lie sl(2):

V = sl(2) =

M =

(y1 y2

y3 −y1

): (y1, y2, y3) ∈ R3

.

Per A ∈ SL(2,R) la rappresentazione aggiunta Ad : SL(2,R)→ GL(V ) e data da

Ad(A) : V −→ V, Ad(A)(M) = AMA−1.

Poiche det(A) = 1,

det(M) = −y21 − y2y3, det(AMA−1) = det(A) det(M) det(A)−1 = det(M),

l’applicazione Q : M 7→ det(M) e una forma quadratrica su V e Ad(A) ∈ O(Q) per ogniA ∈ SL(2,R). Cambiando coordinate in V , y1 = x1, y2 = x2 − x3, y3 = x2 + x3 otteniamoQ(M) = −x2

1−x22 +x2

3, quindi Q e equivalente a Q1,2 e percio O(Q) ∼= O(1, 2) ∼= O(2, 1). Percio

Ad : SL(2,R) −→ SO(2, 1)o, A 7−→ Ad(A)

Page 162: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 162

e un omomorfismo di gruppi di Lie e si puo verificare che ρ e suriettivo con nucleo ±I.

9.2.4 Il gruppo O(2, 2). Consideriamo lo spazio vettoriale V delle matrici 2× 2:

V =

M =

(y1 y3

y4 y2

): (y1, y2, y3, y4) ∈ R4

.

Per A,B ∈ SL(2,R) definiamo un’applicazione lineare

r(A,B) : V −→ V, r(A)(M) = AM tB.

Poiche det(A) = det(B) = 1,

det(M) = y1y2 − y3y4, det(AM tB) = det(A) det(M) det(B) = det(M),

l’applicazione Q : M 7→ det(M) e una forma quadratrica su V e r(A) ∈ O(Q) per ogniA,B ∈ SL(2,R). Cambiando coordinate in V , y1 = x1 + x3, y2 = x1 − x3, y3 = x2 + x4,y4 = x2 − x4, otteniamo Q(M) = x2

1 + x22 − x2

3 − x24, quindi Q e equivalente a Q2,2 e percio

O(Q) ∼= O(2, 2). L’applicazione

r : SL(2,R)× SL(2,R) −→ SO(2, 2)o, (A,B) 7−→ r(A,B)

e un omomorfismo di gruppi di Lie e si puo verificare che r e suriettiva con nucleo ±I.

9.2.5 Il gruppo O(3, 1). Consideriamo lo spazio vettoriale V delle matrici 2× 2 Hermitiane(cioe tM = M): :

V =

M =

(y1 y3 + iy4

y3 − iy4 y2

): (y1, y2, y3, y4) ∈ R4

.

Per A ∈ SL(2,C) definiamo un’applicazione R-lineare

r(A) : V −→ V, r(A)(M) = AM tA.

Poiche det(A) = 1,

det(M) = y1y2 − y23 − y2

4, det(AM tA) = det(A) det(M)det(A) = det(M),

l’applicazione Q : M 7→ det(M) e una forma quadratrica su V e r(A) ∈ O(Q) per ogniA ∈ SL(2,C). Cambiando coordinate in V , y1 = x1 + x2, y2 = x1 − x2, y3 = x3, y4 = x4,otteniamo

Q(M) = x21 − x2

2 − x23 − x2

4,

quindi Q e equivalente a Q1,3 e percio O(Q) ∼= O(1, 3) ∼= O(3, 1). L’applicazione

r : SL(2,C) −→ SO(3, 1)o, A 7−→ r(A)

e un omomorfismo di gruppi di Lie e si puo verificare che r e suriettivo con nucleo ±I.

Page 163: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 163

9.3 Quaternioni.

9.3.1 Quaternioni, Sp(1) e SU(2). I quaternioni sono una generalizzazione dei numericomplessi, come i numeri complessi sono una generalizzazione dei numeri reali. Un quaternionee formalmente una coppia di numeri complessi, ma e piu comodo scriverlo nella forma

h = z + wj, dove si ha j2 = −1, jz = zj (z, w ∈ C).

Si noti che il prodotto non e commutativo. L’addizione e data da:

(z + wj) + (z′ + w′j) = (z + z′) + (w + w′)j.

Il prodotto e dato da:

(z + wj)(z′ + w′j) = zz′ + zw′j + wjz′ + wjw′j= zz′ + zw′j + wz′j + ww′j2

= (zz′ − ww′) + (zw′ + wz′)j.

So puo verificare che valgono le proprieta di associativita per l’addizione e moltiplicazione e ladistributivita. Se z = a+ bi, w = c+ di con a, . . . , d ∈ R, un quaternione si scrive:

h = z + wj = (a+ bi) + (c+ di)j = a+ bi+ cj + dk, k := ij = −ji (a, . . . , d ∈ R).

Si verifica facilmente che anche k2 = −1. L’algebra dei quaternioni si indica con H.Una proprieta importante dei quaternioni e che ogni elemento non-zero ha un inverso

moltiplicativo, si dice che H e un corpo. Definiamo prima il coniugato di un quarternioneh per:

h = z + wj = z − wj = a− bi− cj − dk, si ha hh′ = h′ h.

Si verifica chehh = zz + ww = a2 + b2 + c2 + d2 (∈ R≥0),

quindi hh e sempre reale ed e zero soltanto se h = 0. Percio, se h 6= 0, h−1 := (hh)−1h el’inverso di h. La norma di un quaternione e

|h| =√hh ∈ (R≥0).

La norma e un omomorfismo di gruppi moltiplicativi H∗ := H− 0 → R∗>0 perche

|hh′|2 = (hh′)hh′ = h(h′h′)h = (hh)(h′h′) = |h|2|h′|2

dove abbiamo usato che il numero reale h′h′ commuta con ogni quaternione, in particolare conh. Il nucleo della norma:

Sp(1) := h ∈ H∗ : |h| = 1 = a+ bi+ cj + dk ∈ H : a2 + b2 + c2 + d2 = 1

Page 164: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 164

e allora un sottogruppo moltiplicativo. Poiche S3 e una varieta (una sottovarieta di R4) siverifica facilmente che Sp(1) e un gruppo di Lie. E’ noto che Sn e un gruppo di Lie soltanto sen = 1, 3.

L’algebra dei quaternioni e isomorfa a una sottoalgebra dall’algebra delle matrici M2(C):

X : H −→M2(C), h = z + wj 7−→ Xh =

(z w−w z

),

quindi X e iniettiva e per h, h′ ∈ H si ha:

Xh+h′ = Xh +Xh′ , Xhh′ = XhXh′ ; in piu |h|2 = det(Xh),

come si verifica facilmente. I quaternioni i, j, k corrispondono alle matrici di Pauli:

Xi =

(i 00 −i

)= σ1, Xj =

(0 1−1 0

)= σ2, Xk =

(0 ii 0

)= σ3.

Tramite la mappa X si ottiene un isomorfismo di gruppi di Lie (si veda Esercizio 9.3.3):

X : Sp(1) −→ SU(2) = A ∈ GL(2,C) : tAA = I, det(A) = 1 ,

dove SU(2) e il gruppo unitario speciale in dimensione 2.

9.3.2 Esercizio. Sia x = x0 +x1i+x2j+x3k un quaternione, definiamo ~x = (x1, x2, x3) ∈ R3.Verificare che

xy = z0 + z1i+ z2j + z3k, con

z0 = x0y0 − (~x, ~y),~z = x0~y + y0~x+ ~x× ~y.

9.3.3 Esercizio. Sia

A =

(z wu v

)∈M2(C).

Mostrare che A ∈ U(2) = B ∈ GL(2,C) : tBB = I se e solo sezz + uu = 1,ww + vv = 1, se e solo se u = −w, v = z.zw + uv = 0,

9.3.4 SO(3,R) e la rappresentazione Aggiunta per SU(2). Sia G = SU(2), usandoper esempio il diffeomorfismo SU(2) ∼= S3 (si veda 9.3.1) si ottiene:

su(2) := TISU(2) ∼= X ∈M2(C) : tX +X = 0, tr(X) = 0

=

M =

ix1 x2 + ix3

−x2 + ix3 −ix1

: (x1, x2, x3) ∈ R3

∼= R3.

Page 165: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 165

La rappresentazione Aggiunta di SU(2) e allora un omomorfismo di gruppi di Lie:

Ad : SU(2) −→ GL(3,R) ∼= GL(su(2)), Ad(A)(M) = AMA−1.

Poiche det(A) = 1,

det(M) = x21 + x2

2 + x23, det(AMA−1) = det(A) det(M) det(A)−1 = det(M),

l’applicazione Q : M 7→ det(M) e una forma quadratrica su V e Ad(A) ∈ O(Q) ∼= O(3,R) perogni A ∈ SL(2,C). Poiche SU(2) ∼= S3 e connesso e Ad(1) = I allora Ad(SU(2)) ⊂ SO(3,R).Si puo verificare che

Ad(SU(2)) = SO(3,R), ker(Ad) = ±1.

9.3.5 Il gruppo ortogonale SO(4,R). Consideriamo lo spazio vettoriale reale quattrodimensionale H, equivalentemente, lo spazio delle matrici 2× 2 seguenti (si veda 9.3.1): :

H ∼=M =

(x0 + ix1 x2 + ix3

−x2 + ix3 x0 − ix1

): (x0, x1, x2, x3) ∈ R4

.

Per A,B ∈ SU(2) ⊂ H× definiamo un’applicazione lineare

r(A,B) : H −→ H, r(A,B)(M) = AMB−1,

(A,B,M ‘sono’ quaternioni, quindi anche AMB−1 ‘e’ un quaternione!). Poiche det(A) =det(B) = 1,

det(M) = x20 + x2

1 + x22 + x2

3, det(AMB−1) = det(A) det(M) det(B)−1 = det(M),

l’applicazione Q : M 7→ det(M) e una forma quadratrica su V e r(A,B) ∈ O(Q) ∼= O(4,R) perogni A,B ∈ SU(2). Poiche SU(2) e connessa otteniamo un’applicazione

r : SU(2)× SU(2) −→ SO(4,R), A 7−→ r(A,B)

che e un omomorfismo di gruppi di Lie e si puo verificare che r e suriettivo con nucleo(I, I), (−I,−I).

9.4 Il gruppo ortogonale SO(2m)

9.4.1 L’algebra di Lie so(2m). Per determinare un’algebra di Cartan dell’algebra di Lieso(2m) scegliamo una base di C2m tale che la forma quadratica sia data da

x1xm+1 + . . .+ xmx2m = txQx/2, Q =

(0 II 0

),

Page 166: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 166

dove la matrice simmetrica Q e divisa in blocchi m×m. L’algebra di Lie so(2m) ⊂M2m(C) edata dalle matrici X ∈M2m(C) tali che

tXQ+QX = 0, sia X =

(A BC D

).

Allora l’equazione per X diventa:(tA tCtB tD

)(0 II 0

)+

(0 II 0

)(A BC D

)=

(tC tAtD tB

)+

(C DA B

)=

(0 00 0

),

quindi otteniamo le equazioni seguenti per le matrici m×m in X:

tA = −D, tB = −B, tC = −C.

Verifichiamo che la dimensione di so(2m) e (2m)(2m − 1)/2 = 2m2 −m. Poiche A ∈ Mm(C),che ha dimensione m2, e B,C ∈ Mm(C) sono antisimmetriche, si trova infatti dim so(2m) =m2 + 2m(m− 1)/2 = 2m2 −m.

9.4.2 Le radici di so(2m). Si noti che la seguente sottoalgebra di matrici diagonali sta inso(2m):

h = H = diag(t1, . . . , tm,−t1, . . . ,−tm) : ti ∈ C , sia Hi = Ei,i − Ei+m,i+m ∈ h.

Consideriamo gli autospazi in so(2m), per la rappresentazione aggiunta, di questa sottoalgebra.Una base di so(2m) e data dalle Hi e le

Ei,j − Ej+m,i+m, Ek,l+m − El,k+m, Ek+m,l − El+m,k,

dove 1 ≤ i, j, k, l ≤ m, i 6= j e k < l. Le prime matrici hanno A = −tD e B = C = 0, poici sono quelle con A = C = 0 e B = −tB e infine ci sono quelle con A = B = 0 e tC = −C.Poiche [diag(t1, . . . , t2m), Ea,b] = (ta − tb)Ea,b e ora ti+m = −ti si ha:

[H,Ei,j − Ej+m,i+m] = (ti − tj)(Ei,j − Ej+m,i+m),[H,Ek,l+m − El,k+m] = (tk + tl)(Ek,l+m − El,k+m),[H,Ek+m,l − El+m,k] = −(tk + tl)(Ek+m,l − El+m,k).

Questo implica che se X ∈ so(2m), X 6∈ h allora [H,X] 6= 0 per un certo H ∈ h. Quindi h euna sottoalgebra commutativa massimale, e percio h e un’algebra di Cartan di so(2m). In piuabbiamo trovato la decomposizione di so(2m) in spazi peso per la rappresentazione aggiunta.Le radici di so(2m) sono:

Li − Lj, ±(Lk + Ll), 1 ≤ i, j, k, l ≤ m, i 6= j, k < l.

Ogni applicazione l : h∗R = Rn = ⊕RLi → R, l(∑aiLi) =

∑liai con li > li+1 > 0 e regolare (si

veda 7.3.1). Le radici positive sono gli Li − Lj con i < j e gli Lk + Ll con k < l.

Page 167: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 167

Si puo verificare, similmente al caso di sl(n), si veda 7.1.15, che il gruppo di Weyl agiscenel modo seguente. Se α = Li − Lj la riflessione sα permuta Li e Lj e fissa gli altri radici. Seα = Lk + Ll,

sα : Lk 7→ −Ll, Ll 7→ −Lk, Li 7→ Li (α = Lk + Ll, i 6= k, l).

Il prodotto scalare su h∗R definito dalla forma di Killing su h e invariante per il gruppo di Weyle percio e uguale, a meno di moltipicazione per uno scalare, al prodotto scalare standard datoda (Li, Lj) = δij. Si ha (α, α) = 2 per ogni radice α e percio < λ, α >= 2(λ, α)/(α, α) = (λ, α)per ogni λ ∈ h∗R.

Le radici semplici sono

α1 = L1 − L2, α2 = L2 − L3, . . . , αm−1 = Lm−1 − Lm, αm = Lm−1 + Lm.

Il loro diagramma di Dynkin e il seguente:c c c c c cc

α1 α2 α3 αn−3 αn−2

αn

αn−1Dn

9.4.3 Le rappresentazioni fondamentali di so(2m). I pesi fondamentali λi, i = 1, . . . ,m,di so(2m), definiti da < λi, αj >= (λi, αj) = δij (si veda 8.1.4). Poiche (α, α) = 2 per ogniα ∈ R si ha < λi, αj >:= 2(λi, αj)/(αj, αj) = (λi, αj), quindi:

λ1 = L1, λ2 = L1 + L2, . . . , λm−2 = L1 + L2 + . . .+ Lm−2,

λm−1 =L1 + L2 + . . .+ Lm−1 − Lm

2, λm =

L1 + L2 + . . .+ Lm−1 + Lm2

.

I pesi dominanti di so(2m) sono allora:

Λ+W =

∑mi=1miλi : mi ∈ Z≥0

=

(m1 + . . .+mm−2 + (mm−1+mm)2

L1 + . . .+ (mm−1+mm)2

Lm−1 + (−mm−1+mm)2

Lm

.

Quindi un peso λ =∑m

i=1 aiLi e dominante se a1 ≥ a2 ≥ . . . ≥ am−1 ≥ |am| (e poi mm =am−1 + am, mm−1 = am−1 − am, mm−2 = am−2 − am−1, . . ., m1 = a1 − a2).

Nella rappresentazione standard di so(2m) su V := C2m, l’algebra di Cartan e data dalleH = diag(t1, . . . , tm,−t1, . . . ,−tm) e Li(H) = ti per i = 1, . . . ,m. Quindi i pesi di V sono gli±Li e l’unico peso dominante tra di loro e L1. Percio si ha:

V (λ1) = V, V = C2m.

Si puo mostrare (si veda [FH], Thm 19.2) che

V (λk) = ∧kV, k = 1, 2, . . . ,m− 2.

Page 168: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 168

Un vettore con peso massimale in V (λk) = ∧kV e ovviamente e1 ∧ e2 ∧ . . . ∧ ek. Anche larappresentazione ∧m−1V e irriducibile, ma il suo peso massimale e L1 + . . .+Lm−1 = λm−1 +λm,che non e un peso fondomentale. La rappresentazione ∧mV e riducibile.

Poiche le rappresentazioni V (λm−1), V (λm) hanno pesi con coefficienti che non sono in-teri rispetto alla base L1, . . . , Lm di h∗R, non e possibile trovarli nei prodotti tensoriali delleV (λ1), . . . , V (λm−2) (che poi sono tutti contenuti nei prodotti tensoriali di V = V (λ1)), percheogni peso in una tale rappresentazione e una combinazione con coeficienti interi di L1, . . . , Lm.

I pesi di V (λm−1), la rappresentazione irriducibile generata da un vettore massimale conpeso λm−1, sono del tipo λm−1 −

∑mi=1 niαi con ni ≥ 0 (si veda 8.2.6). Nessuno di questi pesi

e dominante, tranne λm−1 stesso. Poiche ogni peso e nell’orbita di un peso dominante per ilgruppo di Weyl, ogni peso di V (λm−1) e nell’orbita di λm−1. Percio ogni spazio peso di V (λm−1)e isomorfo allo spazio del peso massimale, in particolare, e unidimensionale. Il gruppo di Weylagisce per permutazioni delle Li e cambiamenti di un numero pari di segni, quindi i pesi diV (λm−1) sono:

(ε1L1 + ε2L2 + . . .+ εmLm)/2, εi ∈ +1,−1, ε1ε2 · · · εm = −1.

In modo simile, i pesi di V (λm) sono:

(ε1L1 + ε2L2 + . . .+ εmLm)/2, εi ∈ +1,−1, ε1ε2 · · · εm = +1.

Ogni peso di V (λm−1) e di V (λm) ha moltiplicita uno e ogni rappresentazione ne ha 2m−1,quindi:

dimV (λm−1) = 2m−1, dimV (λm) = 2m−1.

Le rappresentazioni fondamentali V (λm−1) e V (λm) si chiamano rappresentazioni spinoriali(Inglese: (half) spin representations). Costruiremo queste rappresentazioni di so(2m) in 10.3.5.

9.4.4 Il caso so(4). Nel caso m = 2, l’algebra di Lie so(4) e data da:

so(4) = 〈H1−H2, E1,2−E4,3, E2,1−E3,4 〉 ⊕ 〈H1 +H2, E1,4−E2,3, E3,2−E4,1 〉 ∼= sl(2) ⊕ sl(2),

l’isomorfismo manda i tre generatori di ogni coppia nei generatori standard di sl(2). La rappre-sentazione standard C4 di so(4) ha pesi λ = L1, L2,−L1,−L2. Si ha λ(H1−H2) = 1,−1,−1, 1e λ(H1 +H2) = 1, 1,−1,−1, quindi C4 e isomorfa a due copie della rappresentazione standarddue dimensionale di ognuna delle due copie di sl(2). Da qui segue che C4 ∼= W1 ⊗W2 doveW1,W2 sone le rappresentazioni standard delle due copie di SL(2).

Le rappresentazioni due dimensionali di so(4) ottenute come la composizione

ρi : so(4) ∼= sl(2) ⊕ sl(2)πi−→ sl(2) → End(C2)

sono rappresentazioni due dimensionali, irriducibili, di so(4). Poiche ρ1(H1−H2) = diag(1,−1),ρ1(H1 +H2) = 0, i pesi di ρ1 sono aL1 + bL2 con a− b = ±1 e a+ b = 0, quindi ±(L1−L2)/2.Percio ρ1 e una delle due rappresentazioni spinoriali di so(4). In modo simile si trova che i pesidi ρ2 sono ±(L1 + L2)/2 e quindi anche ρ2 e una rappresentazione spinoriale.

Page 169: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 169

9.5 Il gruppo ortogonale SO(2m+ 1)

9.5.1 L’algebra di Lie so(2m + 1). Per determinare un’algebra di Cartan dell’algebra diLie so(2m+ 1) scegliamo una base di C2m+1 tale che la forma quadratica sia dato da

x1xm+1 + . . .+ xmx2m + x22m+1 = txQx, Q =

I 0 00 I 00 0 1

,

dove la matrice simmetrica Q e divisa in quattro blocchi m×m, due blocchi 1×m, due blocchim × 1 e un blocco 1 × 1. L’algebra di Lie so(2m + 1) ⊂ M2m+1(C) e data dalle le matriciX ∈M2m+1(C) tali che

tXQ+QX = 0, sia X =

A B aC D btc td e

, quindi tX =

tA tC ctB tD dta tb e

con A,B,C,D ∈Mm(C), a, b, c, d,∈ Cm e e ∈ C. Allora le equazioni per X diventano: tC tA c

tD tB dtb ta e

+

C D bA B atc td e

=

0 0 00 0 00 0 0

,

quindi otteniamo le equazioni seguenti per i blocchi di X:

tA = −D, tB = −B, tC = −C, d = −a, c = −b, e = 0.

Verifichiamo che la dimensione di so(2m+1) e (2m+1)(2m)/2 = 2m2 +m. Poiche A ∈Mm(C),che ha dimensione m2, e B,C ∈ Mm(C) sono antisimmetriche e a, b ∈ Cm, si trova infattidim so(2m) = m2 + 2m(m− 1)/2 + 2m = 2m2 +m.

9.5.2 Le radici di so(2m+ 1). Si noti che la seguente sottoalgebra di matrici diagonali stain so(2m+ 1):

h = H = diag(t1, . . . , tm,−t1, . . . ,−tm, 0) : ti ∈ C , sia Hi = Ei,i − Ei+m,i+m ∈ h.

Consideriamo gli autospazi in so(2m + 1), per la rappresentazione aggiunta, di questa sot-toalgebra. Una base di so(2m + 1) e dato dalle Hi e le matrici indicate qui sotto. Poiche[diag(t1, . . . , t2m, t2m+1), Ea,b] = (ta − tb)Ea,b e adesso ti+m = −ti, t2m+1 = 0 si ha:

[H,Ei,j − Ej+m,i+m] = (ti − tj)(Ei,j − Ej+m,i+m), 1 ≤ i, j ≤ m, i 6= j,[H,Ek,l+m − El,k+m] = (ti − tj)(Ei,j − Ej+m,i+m), 1 ≤ i, j ≤ m, i 6= j,[H,Ek,l+m − El,k+m] = (tk + tl)(Ek,l+m − El,k+m), 1 ≤ k < l ≤ m,[H,Ek+m,l − El+m,k] = −(tk + tl)(Ek+m,l − El+m,k), 1 ≤ k < l ≤ m,

[H,Ep,2m+1 − E2m+1,p+m] = tp(Ep,2m+1 − E2m+1,p+m), 1 ≤ p ≤ m,[H,Ep+m,2m+1 − E2m+1,p] = −tp(Ep+m,2m+1 − E2m+1,p), 1 ≤ p ≤ m.

Page 170: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 170

Questo implica che se X ∈ so(2m+ 1), X 6∈ h allora [H,X] 6= 0 per un certo H ∈ h. Quindi h

e una sottoalgebra commutativa massimale, e percio h e un’algebra di Cartan di so(2m + 1).In piu abbiamo trovato la decomposizione di so(2m+ 1) in spazi peso per la rappresentazioneaggiunta. Le radici di so(2m+ 1) sono:

Li − Lj, ±(Lk + Ll), ,±Lp 1 ≤ i, j, k, l, p ≤ m, i 6= j, k < l.

Ogni applicazione l : h∗R = Rn = ⊕RLi → R, l(∑aiLi) =

∑liai con li > li+1 > 0 e regolare

(si veda 7.3.1). Le radici positive sono gli Li − Lj con i < j, gli Lk + Ll con k 6= l e gli Lp,1 ≤ p ≤ m.

Si puo verificare, similmente al caso di sl(n), si veda 7.1.15, che il gruppo di Weyl agiscenel modo seguente. Se α = Li − Lj la riflessione sα permuta Li e Lj e fissa le altre radici. Seα = Lk + Ll,

sα : Lk 7→ −Ll, Ll 7→ −Lk, Li 7→ Li (α = Lk + Ll, i 6= k, l)

e sLp manda Lp 7→ −Lp e fissa gli altri Lq.Il prodotto scalare su h∗R definito dalla forma di Killing su h e invariante sotto il gruppo di

Weyl e percio e uguale, a meno di moltiplicazione per uno scalare, al prodotto scalare standarddato da (Li, Lj) = δij. Si noti che le radici di so(2m + 1) sono esattamente i vettori α con(α, α) = 1, 2, quindi il sistema di radici e Bn (si veda 7.3.5).

Le radici semplici sono

α1 = L1 − L2, α2 = L2 − L3, . . . , αm−1 = Lm − Lm−1, αm = Lm.

Il loro diagramma di Dynkin e il seguente:e e e e e e>α1 α2 α3 αn−2 αn−1 αn

Bn

9.5.3 Le rappresentazioni fondamentali di so(2m + 1). I pesi fondamentali λi, i =1, . . . ,m, di so(2m), definiti da

< λi, αj >= 2(λi, αj)/(αi, αi) = δij

(si veda 8.1.4) sono:

λ1 = L1, λ2 = L1 + L2, . . . , λm−1 = L1 + L2 + . . .+ Lm−1,

λm =L1 + L2 + . . .+ Lm−1 + Lm

2.

I pesi dominanti di so(2m) sono allora:

Λ+W =

∑mi=1miλi : mi ∈ Z≥0

=

(m1 + . . .+mm−1 + mm2

)L1 + . . .+ (mm−1 + mm2

)Lm−1 + mm2Lm.

Page 171: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

9 GRUPPI ORTOGONALI 171

Quindi un peso λ =∑m

i=1 aiLi e dominante se a1 ≥ a2 ≥ . . . ≥ am−1 ≥ am ≥ 0 (e dunquemm = 2am, mm−1 = am−1 − 2am, mm−2 = am−2 − am−1, . . ., m1 = a1 − a2).

Nella rappresentazione standard di so(2m + 1) su V := C2m+1, l’algebra di Cartan e datadalle H = diag(t1, . . . , tm,−t1, . . . ,−tm, 0) e Li(H) = ti per i = 1, . . . ,m. Quindi i pesi di Vsono ±Li e 0. Si puo mostrare (si veda [FH], Thm 19.14) che

V (λk) = ∧kV, k = 1, 2, . . . ,m− 1.

Un vettore con peso massimale in Vλk = ∧kV e ovviamente e1∧e2∧. . .∧ek. La rappresentazione∧mV e anche irriducibile, ma il suo peso massimale e L1 + . . .+ Lm = 2λm, che non e un pesofondamentale.

Poiche la rappresentazione V (λm) ha pesi con coefficienti che non sono interi rispetto allabase L1, . . . , Lm di h∗R, non e possibile trovarli nei prodotti tensoriali delle V (λ1), . . . , V (λm−1)(che poi sono tutti contenuti nei prodotti tensoriali di V = V (λ1)).

I pesi di V (λm), la rappresentazione irriducibile generata da un vettore massimale con pesoλm, sono del tipo λm −

∑mi=1 niαi con ni ≥ 0. Nessuno di questi pesi e dominante, tranne λm

stesso. Poiche ogni peso e nell’orbita di un peso dominante per il gruppo di Weyl, ogni pesodi V (λm) deve essere nell’orbita di λm. In piu, ogni spazio peso e isomorfo allo spazio del pesopiu alto, in particolare, e unidimensionale. Il gruppo di Weyl agisce per permutazioni delle Lie cambiamenti di segno, quindi i pesi di V (λm) sono i:

(ε1L1 + ε2L2 + . . .+ εmLm)/2, εi ∈ +1,−1.

Ogni peso di V (λm) ha moltiplicita uno e la rappresentazione ne ha 2m, quindi:

dimV (λm) = 2m.

La rappresentazione fondamentale V (λm) si chiama rappresentazione spinoriale (Inglese: spinrepresentation). Costruiremo questa rappresentazione di so(2m+ 1) in 10.3.6.

9.5.4 Il caso so(3). Nel caso m = 1, l’algebra di Lie so(3) ha base H1, E1,3−E3,2, E2,3−E3,1

ed e isomorfo con sl(2). La rappresentazione standard C3 di so(3) ha peso dominante L1 = 2λ1,e la rappresentazione con peso dominante λ1 e la rappresentazione standard C2 di sl(2). Larappresentazione C3 e S2(C2) di sl(2), che e anche la rappresentazione aggiunta. Vedi 9.2.3 peril legame tra i gruppi di Lie nel caso K = R (che si generalizza al caso K = C).

Page 172: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 172

10 Rappresentazioni di Spin

Testi consigliati: [FH].

10.1 L’algebra di Clifford

10.1.1 Definizione. L’algebra di Clifford di una forma quadratica generalizza l’algebra deiquaternioni e permette di definire le rappresentazioni spinoriali dei gruppi ortogonali.

Sia V uno spazio vettoriale su un campo K, con K = R oppure K = C e sia Q : V → Kuna forma quadratica definita da una forma bilineare B, Q(v) = B(v, v) e poi (si veda 9.1.4):

Q(v + w)−Q(v)−Q(w) = 2B(v, w) (v, w ∈ V ).

L’algebra di Clifford di (V,Q), indicata con C(Q), e una K-algebra che contiene K e V , in piu,il prodotto di un v ∈ V ⊂ C(Q) con se stesso e tale che v2 = Q(v)(!).

Per costruire C(Q) consideriamo l’ideale bilaterale IQ dell’algebra tensoriale T (V ) = ⊕kV ⊗k(si veda 1.3.3) generato dagli elementi

v ⊗ v −Q(v) ∈ T (V ) (v ∈ V ).

Quindi un elemento di IQ e una combinazione lineare di elementi del tipo x⊗ (v⊗v−Q(v))⊗ycon x, y ∈ T (V ) e v ∈ V . Nel caso Q = 0, si ottiene l’ideale I di 1.3.3 e T (V )/I e l’algebraesterna. In generale, l’algebra che si ottiene e per definizione l’algebra di Clifford (di Q):

C(Q) := T (V )/IQ =(⊕V ⊗k

)/IQ.

Ci sono testi in cui si usa −Q per definire C(Q), cioe si usa l’ideale generato dalle x⊗x+Q(x)invece di IQ. I gruppi ortogonali di Q e −Q sono ovviamente uguali e si puo mostrare cheil gruppo Spin e le rappresentazioni spinoriali di so(Q) non cambiano. Usiamo le seguentenotazioni (si veda 9.1.4):

C(p, q) := C(Ip,q), se K = R; C(n) = C(In) se K = C.

Ci sono le applicazioni lineari V ⊗k → T (V )π→ C(Q) dove π e la mappa canonica che manda

x 7→ x + IQ. Queste applicazioni sono iniettive se k = 0, 1 (si veda 10.1.4). Per λ ∈ K = V ⊗0

o v ∈ V = V ⊗1 scriviamo semplicemente λ e v per l’immagine di λ e v in C(Q). Allora si ha:

v2 = Q(v), vw + wv = 2B(v, w) (v, w ∈ V ⊂ C(Q)),

la prima relazione segue dal fatto che v ⊗ v − Q(v) ∈ IQ quindi v2 − Q(v) = 0 in C(Q), laseconda segue da Q(v + w)−Q(v)−Q(w) = 2B(v, w) e:

Q(v + w) = (v + w)2 = v2 + w2 + vw + vw = Q(v) +Q(w) + vw + wv.

Sia ei, 1 ≤ i ≤ n = dimV , una K-base di V . Usando queste regole, l’immagine di un tensoreei1 ⊗ . . .⊗ eik ∈ V ⊗k si scrive come combinazione lineare di prodotti ej1 . . . ejl con l ≤ n e indici

Page 173: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 173

distinti (eja = ejb solo se a = b). In particolare, dimC(Q) ≤ 2n. Si puo dimostrare (si veda10.1.4, [FH], Lemma 20.3) che C(Q) ha una base data dalle eI ,

C(Q) = ⊕I KeI ; eI = ei1ei2 . . . eik se I = i1, . . . , ik, 1 ≤ i1 < i2 < . . . < ik ≤ n,

dove I percorre tutti gli insiemi ordinati con al piu n elementi, e e∅ = 1. In particolare,dimC(Q) = 2n.

10.1.2 Esempi. Sia V = R2 con base e1, e2. Sia Q = I2, quindi Q(v1e1 + v2e2) = v21 + v2

2.Allora in C(Q) = C(2, 0) si ha

e21 = e2

2 = 1, e1e2 + e2e1 = 0 quindi e1e2 = −e2e1.

In piu il quadrato di e1e2 e:

(e1e2)2 = e1e2e1e2 = e1(−e1e2)e2 = −1 · 1 = −1.

Un semplice calcolo mostra che l’applicazione

F : C(2, 0) −→M2(R), a+ be1 + ce2 + de1e2 7−→(a+ b c− dc+ d a− b

)e un isomorfismo di algebre (cioe F e R-lineare, F (x+ y) = F (x) +F (y) e F (xy) = F (x)F (y)).

Sia V come sopra e sia Q = −I2, allora in C(Q) = C(0, 2) si ha:

e21 = e2

2 = −1, e1e2 = −e2e1, (e1e2)2 = e1(−e1e2)e2 = −1.

Un semplice calcolo mostra che l’applicazione

G : C(0, 2) −→ H, a+ be1 + ce2 + de1e2 7−→ a+ bi+ cj + dk

e un isomorfismo di algebre, dove H e l’algebra di quaternioni (si veda 9.3.1).Sia V come sopra e sia Q = I1,1, allora in C(Q) = C(1, 1) si ha:

e21 = 1, e2

2 = −1, e1e2 = −e2e1, (e1e2)2 = e1(−e1e2)e2 = 1.

Un semplice calcolo mostra che l’applicazione

H : C(1, 1) −→M2(R), a+ be1 + ce2 + de1e2 7−→(

a+ b c+ d−c+ d a− b

)e un isomorfismo di algebre.

Nel caso K = C e Q = I2 si ha C(Q) = C(2) ∼= M2(C).

10.1.3 Le proprieta universale dell’algebra di Clifford. L’algebra di Clifford C(Q) godedelle seguente proprieta, che e molto conveniente per definire automorfismi di C(Q).

Page 174: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 174

Sia E una K-algebra (associativa) con elemento unita 1 ∈ E e sia data un’applicazionelineare

j : V −→ E, tale che j(v)2 = Q(v)

per ogni v ∈ V , allora esiste un unico omomorfismo di K-algebre J che estende j:

J : C(Q) −→ E, tale che J(v) = j(v) (v ∈ V ⊂ C(Q)).

Per definire J , si definisce prima, per ogni k, un’applicazione multilineare V × . . .×V → E per(v1, v2, . . . , vk) 7→ j(v1)j(v2) . . . j(vk). Queste applicazioni definiscono delle mappe lineari Jk :V ⊗k → E (si veda 1.1.8) che sono componenti di un omomorfismo di K-algebre J : T (V )→ E,cioe J = Jk su V ⊗k. Se t ∈ IQ, t e combinazione lineare di x⊗ (v ⊗ v −Q(v))⊗ y e

J(x⊗ (v ⊗ v −Q(v))⊗ y) = J(x)J(v ⊗ v −Q(v))J(y) = J(x)(J(v)J(v)−Q(v))J(y) = 0

perche J(v) = j(v) e j(v)2 = Q(v). Quindi J definisce un’omomorfismo di K-algebre C(Q) =T (V )/IQ → E. L’unicita segue dal fatto che le proprieta J(v) = j(v) e J(x ⊗ y) = J(x)J(y)determinano l’immagine di ogni tensore in T (V ) mediante J .

10.1.4 La dimensione di C(Q). Si ricordi che C(Qp,q) →M2(C) se p+ q = 2, per esempioC0,2∼= H → M2(C), si veda 9.3.1. Dato un omomorfismo iniettivo φ : C(Qp,q) → MN(C), sia

Mi ∈MN(C) l’immagine di ei ∈ Rn. In particolare, si ha

(x1M1 + . . .+ xnMn)2 = (x21 + . . .+ x2

p)− (x2p+1 + . . .+ x2

n)IN = Qp,q(x)IN ,

equivalentamente, gli Mi soddisfano:

MiMj +MjMi = 0, M2i = εiIN , εi =

1 se 1 ≤ i ≤ p,−1 se p+ 1 ≤ i ≤ n,

Sia Q = Qp+1,q oppure Qp,q+1, quindi Q(en+1) = 1 oppure −1. Definiamo un’applicazionelineare

Rn+1 −→M2N(C), ei 7−→M ′i :=

(0 Mi

Mi 0

), en+1 7−→M ′

n+1 =

(0 η−η 0

),

dove η = i se Q(en+1) = +1 e η = 1 se Q(en+1) = −1. Allora si verifica facilmente che gli M ′i

soddisfano le stesse relazioni degli Mi e in piu

(M ′n+1)2 = Q(en+1), M ′

iM′n+1 +M ′

n+1M′i = 0,

quindi si ha: (n+1∑i=1

xiM′i

)2

= Q(n+1∑i=1

xiei).

Percio la proprieta universale di C(Q) da un omomorfismo di R-algebre

φ : C(Q) −→M2N(C), ei 7−→M ′i .

Page 175: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 175

Poiche φ : C(Qp,q) →MN(C) e definito da ei 7→Mi, 1 ≤ i ≤ n, anche φ e iniettivo su C(Qp,q),φ : Cp,q →M2N(C). Ogni elemento di C(Q) si scrive come x+yen+1 con x, y ∈ C(Qp,q) ⊂ C(Q)e adesso e facile vedere che φ e iniettivo. Si noti che se dimC(Qp,q) = K, allora dim φ(C(Q)) =2K. Per induzione su n = p+ q si conclude che dimC(Q) = 2n se n = dimV e che gli eI sonouna base di C(Q).

10.2 L’algebra di Clifford e il gruppo spinoriale.

10.2.1 L’algebra di Clifford e il gruppo ortogonale. L’inclusione V → E = C(Q) eK-lineare e soddisfa v2 = Q(v) per costruzione. Per ogni A ∈ O(Q), il gruppo ortogonale di Q,anche l’applicazione lineare

jA : V −→ E = C(Q), v 7−→ Av (A ∈ O(Q), v ∈ V )

soddisfa jA(v)2 = (Av)2 = Q(Av) = Q(v). In particolare, esiste un’omomorfismo di K-algebre

JA : C(Q) −→ C(Q) tale che JA(v) = Av (A ∈ O(Q), v ∈ V ⊂ C(Q)).

Consideriamo il caso di un prodotto AB ∈ O(Q) con A,B ∈ O(Q). Allora JABv = ABv eJAB e l’unico omomorfismo con questa proprieta. Poiche anche JA JB e un omomorfismo conJA(JB(v)) = JA(Bv) = ABv si ha

JAB = JAJB, in particolare: JIV = IC(Q),

con IV l’identita su V e JIV = IC(Q) l’identita su C(Q). Percio l’applicazione

J : O(Q) −→ Aut(C(Q)), A 7−→ JA

e un omomorfismo di gruppi, iniettivo perche JAv = Av per v ∈ V ⊂ C(Q).

10.2.2 L’algebra di Clifford pari e l’automorfismo α. Un caso particolare di A ∈ O(Q)e A = −IV = −I. Si indica

α := J−I : C(Q) −→ C(Q), α2 = IC(Q)

perche (−IV )2 = IV . La decomposizione di C(Q) in autospazi e indicata con

C(Q) = C(Q)+ ⊕ C(Q)−, C(Q)± = x ∈ C(Q) : α(x) = ±x .

Dato che α e K-lineare e α(xy) = α(x)α(y) e facile verificare che C(Q)+ e una sottoalgebra diC(Q).

Per un elemento di base eI di C(Q), si veda 10.1.1 con ]I = k, si ha α(eI) = (−1)keI , quindi

C(Q)+ = ⊕I KeI , ]I ∈ 0, 2, . . ., quindi dimC(Q)+ = 2n−1.

Page 176: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 176

Per λ ∈ C×, le algebre C(Q) e C(λQ) sono isomorfe, perche λ = µ2 per un µ ∈ C× el’applicazione lineare

jµ : V −→ C(λQ), v 7−→ µ−1v

soddisfa jµ(v)2 = (µ−1v)2 = µ−2v2 = µ−2λQ(v) = Q(v) in C(λQ), quindi jµ si estende aun omomorfismo di C-algebre Jµ : C(Q) −→ C(λQ). Per simmetria, si ha un omomorfismoJµ−1 : C(λQ) −→ C(Q) e Jµ−1 e l’inverso di Jµ (perche Jµ−1(Jµ(v)) = v per ogni v ∈ Ve quindi sia Jµ−1 Jµ, sia 1C(Q), e l’unica estensione di 1V . Negli esempi 10.1.2 si vede cheC(Q) 6∼= C(−Q) nel caso K = R.

Invece per ogni λ ∈ R× si ha C(Q)+ ∼= C(λQ)+ perche se ei e una R-base di V (e quindie una C-base della complessificazione VC) l’omomorfismo Jµ : C(Q)C → C(λQ)C manda eI =ei1 . . . ei2k ∈ C(Q)+ ⊂ C(Q)C in µ−2keI = λ−keI ∈ C(λQ)+ ⊂ C(λQ)C. Quindi Jµ induce unisomorfismo tra le sottoalgebre reali C(Q)+ ⊂ C(Q)C e C(λQ)+ ⊂ C(λQ)C:

Jµ : C(Q)C∼=−→ C(λQ)C induce C(Q)+ ∼=−→ C(λQ)+.

10.2.3 Esempi di algebre di Clifford pari. Nel caso V abbia base e1, e2, come negli esempi10.1.2, l’algebra di Clifford pari e

C+(Q) = K ⊕Ke1e2.

Nel caso K = R, nelle algebre C(2, 0) e C(0, 2) si ha (e1e2)2 = −1. In tali casi C+(Q) ∼= Ctramite a+be1e2 7→ a+bi. Nell’algebra C(1, 1) si ha (e1e2)2 = 1 che implica (1+e1e2)(1−e1e2) =0, (1± e1e2)2 = 2(1± e1e2). Sia

π± := (1± e1e2)/2, allora 1 = π+ + π−, π+π− = 0 = π−π+, π2± = π±,

come si verifica facilmente. In particolare, per x ∈ C+(1, 1) si ha x = x1 = (xπ+) + (xπ−) =x+ +x− e il prodotto e dato da (x+ +x−)(y+ + y−) = (x+y+) + (x−y−). Poiche (a+ be1e2)π± =(a± b)π±, si ottiene un isomorfismo di algebre:

C(1, 1)+ ∼=−→ R× R, x = a+ be1e2 7−→ (a+ b, a− b),

con π+ 7→ (1, 0), π− 7→ (0, 1).L’algebra C+(0, 3)+ ha dimensione 4 e base 1, e1e2, e1e3, e1e3. Poiche e2

i = −1, i = 1, 2, 3, eeiej = eiej in C(0, 3), si ha, se i, j, k sono distinti:

(eiej)2 = eiejeiej = −e2

i e2j = −1, (eiej)(eiek) = −e2

i ejek = ejek = −(eiek)(eiej).

Segue che l’algebra C(0, 3)+ e isomorfa all’algebra dei quaternioni:

C(0, 3)+ ∼=−→ H, a+ be1e2 + ce1e3 + de2e3 7−→ a+ bi+ cj + dk.

Nell’algebra C(0, 3) si ha:

eiω = ωei, dove ω := e1e2e3 ∈ C(0, 3)

Page 177: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 177

e, in piu,ω2 = (e1e2e3)(e1e2e3) = e2

1e2e3e2e3 = −(−1)e22e

33 = +1.

quindi, come prima, gli elementi π± := (1 ± ω)/2 sono idempotenti centrali (cioe commutanocon ogni x ∈ C(0, 3)), e percio C(0, 3) ∼= (π+C(0, 3))× (π−C(0, 3)). E’ facile vedere che

C(0, 3)+ −→ π±C(0, 3), x 7−→ π±x

e un’omomorfismo di algebre iniettivo. Quindi dim π±C(0, 3) ≥ 4, poiche dimC(0, 3) = 8 si haallora dim π±C(0, 3) = 4 e π±C(0, 3) ∼= H. Percio:

C(0, 3)∼=−→ H×H.

10.2.4 Riflessioni e l’algebra di Clifford. In 10.2.1 abbiamo costruito un omomorfismoiniettivo O(Q) → Aut(C(Q)), A 7→ JA. Ora studiamo quest’azione di O(Q) su C(Q), primaper le riflessioni in O(Q).

Sia v ∈ V tale che Q(v) 6= 0. Poiche v2 = Q(v) si ha v−1 = Q(v)−1v in C(Q). Consideriamol’applicazione

ρ(v) : C(Q) −→ C(Q), x 7−→ −vxv−1.

Si consideri il caso in cui x ∈ V , e si ricordi che vx = −xv + 2B(x, v) e Q(x) = B(x, x):

ρ(v)(x) =−vxvQ(v)

=xv2 − 2B(x, v)v

Q(v)=xQ(v)− 2B(x, v)v

Q(v)= x− 2

B(x, v)

B(v, v)v

che mostra che, se K = R e B e un prodotto scalare, ρ(x) coincide su V ⊂ C(Q) con lariflessione Rv rispetto all’iperpiano v⊥ (si veda 7.1.13). In generale, si verifica che ρ(v) ∈ O(Q)e quest’applicazione e detta riflessione.

Si noti che ρ(v) non e un automorfismo di C(Q), per esempio ρ(v)(1) = −v1v−1 = −1mentre un K-algebra automorfismo manda 1 in 1. Gli automorfismi JA, per A ∈ O(Q) sipossono ottenere nel modo seguente. Prima si osservi che per w ∈ V si ha α(w) = −w e quindi

ρ(v)(w) = −vwv−1 = v(−w)v−1 = vα(w)v−1 (v, w ∈ V, B(v) 6= 0).

Per v ∈ V con Q(v) 6= 0 il sollevamento della riflessione Rv ∈ O(Q) e dato da:

JRv : C(Q) −→ C(Q) x 7−→ vα(x)v−1.

Si verifica facilmente che JRv e un automorfismo, per esempio vα(xy)v−1 = vα(x)α(y)v−1 =(vα(x)v−1)(vα(y)v−1). In piu, JRv coincide con Rv su V ⊂ C(Q) e, per l’unicita di un taleautomorfismo, si ha quindi JRv(x) = vα(x)v−1.

Nel caso B sia nondegenere, un teorema di Cartan e Dieudonne afferma che ogni A ∈ O(Q) eun prodotto di riflessioni Rv. Quindi JA e un prodotto di tali JRv . In particolare, sia A ∈ SO(n),

Page 178: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 178

allora A = Rv1 . . . Rv2k per certe vi ∈ V . Poiche α2 = IC(Q), α(xy) = α(x)α(y) e α(v) = −v perv ∈ V , si ha, per ogni x ∈ C(Q):

JA(x) = JRv1 . . . JRv2k (x) = JRv1 . . . JRv2k−1(v2kα(x)v−1

2k )

= JRv1 . . . JRv2k−2(v2k−1α(v2kα(x)v−1

2k )v−12k−1)

= JRv1 . . . JRv2k−2(v2k−1v2kxv

−12k v

−12k−1)

= . . .= v1 . . . v2kx(v1 . . . v2k)

−1.

Quindi per A ∈ SO(Q), l’automorfismo JA di C(Q) e dato dalla coniugazione con v1 . . . v2k ∈C(Q)+.

10.2.5 Il gruppo moltiplicativo di C(Q). Si potrebbe tentare di definire un omomorfismodi gruppi O(Q) → C(Q)×, il gruppo moltiplicativo dato dagli elementi invertibili in C(Q), inmodo tale che Rv 7→ v, allora si avrebbe

A?7−→ x = v1 . . . v2k, se JA(w) = xwx−1.

La formula per Rv mostra pero che Rv = Rλv per ogni non nullo λ ∈ K. Quindi non c’e unascelta canonica per l’immagine di Rv in C(Q)×.

Visto che per definire Rv si dovrebbe avere Q(v) 6= 0, e Q(λv) = λ2Q(v), e ragionevolescegliere λ ∈ K tale che λ2Q(v) = 1 (oppure λ2Q(v) = −1 se K = R e Q(v) < 0). Quindi cisono due scelte ‘naturali’ per λ.

Come gia visto, un tale omomorfismo non esiste sempre, si veda 9.3.4. In quel caso Q = I3,0 eC(Q)+ ∼= C(−Q)+ ∼= H (si veda 10.2.3) e c’e un sottogruppo SU(2) ⊂ H× con un omomorfismosuriettivo SU(2)→ SO(3,R) con nucleo ±I. Questo si puo generalizare, si veda Proposizione10.2.8: esiste un sottogruppo Spin(Q) di (C(Q)+)× che e un rivestimento doppio di SO(Q).

10.2.6 Le antiinvoluzioni τ e ∗ di C(Q). L’algebra T (V ) = ⊕kV ⊗k ha un’antiinvoluzioneτ data da

τ : v1 ⊗ v2 ⊗ . . .⊗ vk 7−→ vk ⊗ vk−1 ⊗ . . .⊗ v1, τ(x⊗ y) = τ(y)⊗ τ(x).

Poche τ(v ⊗ v − Q(v)) = v ⊗ v − Q(v), τ preserva l’ideale τ(IQ) = IQ, segue che τ induceun’antiinvoluzione, ancora indicata con τ :

τ : C(Q) −→ C(Q), τ(v1v2 . . . vk) = vk . . . v2v1, τ(xy) = τ(y)τ(x).

Si noti che se Q(vi) = ±1, allora v2i = ±1 e v1v2 . . . vkτ(v1v2 . . . vk) = v1v2 . . . vkvk . . . v2v1 = ±1.

La composizione di τ e α e l’antiinvoluzione chiamata la coniugazione su C(Q) e si scrive:

τα : C(Q) −→ C(Q), x 7−→ x∗, (v1v2 . . . vk)∗ = (−1)kvk . . . v2v1.

10.2.7 Il gruppo Spin(Q). Ora si puo dare una definizone del gruppo Spin che non sfruttain modo esplicito le reflessioni:

Spin(Q) := x ∈ C(Q)+ : xx∗ = ε, xV x−1 ⊂ V , ε =

±1 se K = R,

1 se K = C.

Page 179: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 179

Il gruppo Spin(Q) e un sottogruppo di (C(Q)+)× (x−1 = εx∗ per x ∈ Spin(Q)) e si puo mostrareche e un gruppo di Lie. Nel caso K = R, Spin(Q) non e connessa se ci sono x ∈ Spin(Q)con xx∗ = −1. Questo occorre soltanto se esiste una base di V tale che Q e dato da Ip,q conp, q ≥ 1.

Per la definizione di Spin(Q), si ha un omomorfismo

ρ : Spin(Q) −→ GL(V ), ρ(x)(w) := xwx−1 (w ∈ V )

10.2.8 Proposizione. Sia B una forma bilineare nondegenere su uno spazio vettoriale V sulcampo K = R o C e sia Q(x) := B(x, x). Allora ρ(Spin(Q)) = SO(Q) e ker(ρ) = ±1.

Dimostrazione. Per la dimostrazione abbiamo bisogno delle riflessioni. Quindi definiamo

Pin(Q) := x ∈ C(Q) : xx∗ = ±1, α(x)V x−1 ⊂ V ,

si noti che Spin(Q) ⊂ Pin(Q). Si definisce un’estensione dell’omomorfismo ρ come

ρ : Pin(Q) −→ GL(V ), ρ(x)(w) = α(x)wx−1.

Per x ∈ Spin(Q) ⊂ C+ si ha α(x) = x e quindi ρ(x)(w) = xwx−1 come prima in 10.2.7.Mostriamo che ρ(Pin(Q)) = O(Q). Si ha ‘⊂’, perche se x ∈ Pin(Q) e w ∈ V si ha

ρ(x)(w) ∈ V quindi (ρ(x)(w))∗ = −ρ(x)(w):

Q(ρ(x)w) = (ρ(x)w)2

= −ρ(x)(w)(ρ(x)(w))∗

= −(α(x)wx−1)(α(x)wx−1)∗

= −α(x)wx−1(x−1)∗w∗α(x)∗

= ∓α(x)ww∗α(x)∗ (xx−1 = 1⇒ (x−1)∗x∗ = 1⇒ (x−1)∗ = (x∗)−1)= ±α(x)w2α(x)∗ (w∗ = −w)= ±Q(w)α(x)α(x)∗ (w2 = Q(w))= ±Q(w)α(xx∗) (xx∗ = ±1⇒ α(xx∗) = ±1)= Q(w).

L’inclusione ‘⊃’ segue dal fatto che se v ∈ V e Q(v) 6= 0 esiste λ ∈ K tale che Q(λv) = ±1.Sia x = λv, allora Rv = Rx e x∗ = −x. Percio xx∗ = −x2 = ∓1 e xwx−1 = −Rx(w) ∈ Vse w ∈ W , quindi x ∈ Pin(Q). Ora si ha ρ(x) = Rx come visto in 10.2.4. Percio ρ(Pin(Q))contiene tutte le riflessioni e dal teorema di Cartan e Dieudonne segue che ρ(Pin(Q)) ⊃ O(Q).

Adesso mostriamo che ρ(Spin(Q)) = SO(Q). Come visto in 10.2.4, dato A ∈ SO(n), ci sonovi ∈ V tali che A = Rv1 . . . Rv2k e inoltre si ha JA(w) = xwx−1 dove x = v1 . . . v2k ∈ C(Q)+.Normalizzando i vi in modo tale che Q(vi) = ±1 se K = R e Q(vi) = 1 se K = C si vede che

xx∗ = (v1 . . . v2k) · (−1)2k(v2k . . . v1) = (v1 . . . v2k−1)Q(v2k)(v2k−1 . . . v1) = . . . = Q(v1) . . . Q(v2k),

che e 1 se K = C e ±1 se K = R, quindi x ∈ Spin(Q) e ρ(x) = A come desiderato.

Page 180: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 180

Determiniamo il nucleo di ρ : Pin(Q) → O(Q). Sia x ∈ ker(ρ), cioe, α(x)v = vx per ogniv ∈ V . Scriviamo x = x+ + x− con x± ∈ C(Q)±, allora segue che

x = x+ + x− ∈ ker(ρ) =⇒ x+v = vx+, −x−v = vx−.

Sia ei una base ortogonale per V , quindi eiej = −ejei se i 6= j e e2i ∈ K − 0. Adesso

scriviamo x+ = x+1 + e1y

−1 dove x+

1 ∈ C(Q)+, y−1 ∈ C(Q)− sono combinazioni lineari degli eIcon 1 6∈ I, cioe e1 non compare in x+

1 e y−1 . In particolare eIe1 = (−1)ke1eI dove k = ]I. Allorase scegliamo v = e1, l’equazione x+v = vx+ da

e1x+1 + e2

1y−1 = x+

1 e1 + e1y−1 e1 cioe e1x

+1 + e2

1y−1 = e1x

+1 − e2

1y−1 ,

percio y−1 = 0, quindi e1 non compare in x+. Procedendo in questo modo si ottiene che x+ noncontiene nessun ei quindi x+ ∈ K. Poi scriviamo x− = x−1 +e1y

+1 dove x−1 ∈ C(Q)−, y+

1 ∈ C(Q)+

e e1 non compare in x−1 e y+1 . Con v = e1 otteniamo

−(e1x−1 + e2

1y+1 ) = x−1 e1 + e1y

+1 e1 cioe − e1x

−1 − e2

1y+1 = −e1x

−1 + e2

1y+1

quindi y+1 = 0 e percio x− non contiene e1, quindi nessun ei, percio x− = 0, perche x− ∈ C(Q)−.

La conclusione e che x = x+ ∈ K.Adesso consideriamo ker(ρ : Spin(Q)→ SO(Q)), quindi imponiamo la condizione xx∗ = 1

se K = C e xx∗ = ε se K = R. Poiche x∗ = x per x ∈ K e x2 = 1 implica x = ±1, segue cheker(ρ) = ±1. 2

10.3 Le rappresentazioni spinoriali di so(n).

10.3.1 L’inclusione so(Q) → C(Q)+. L’omomorfismo di gruppi di Lie ρ : Spin(Q) →SO(Q) induce un isomorfismo di algebre di Lie

(dρ)1 : T1Spin(Q) = Lie(Spin(Q)) −→ TISO(Q) = so(Q).

Poiche Spin(Q) ⊂ (C(Q)+)×, il gruppo dei elementi invertibili in C(Q)+, e C(Q)+ e uno spaziovettoriale, si ha Lie(Spin(Q)) ⊂ C(Q)+.

In piu, e facile verificare (come gia fatto nel caso analogo di GL(n,R) = Mn(R)× ⊂Mn(R),si veda 5.2.1) che le parentesi di Lie su Lie(Spin(Q)) sono date da [X, Y ] = XY − Y X doveXY e il prodotto di X, Y ∈ Lie(Spin(Q)) ⊂ C(Q)+ in C(Q)+:

so(Q) ∼= T1Spin(Q) → C(Q)+, [X, Y ] = XY − Y X (X, Y ∈ so(Q) ⊂ C(Q)+).

Si noti che ora abbiamo trovato una rappresentazione dell’algebra di Lie so(Q) sullo spaziovettoriale C(Q)+:

so(Q) −→ End(C(Q)+), X 7−→ [x 7→ Xx].

Cioe, X ∈ so(Q) ⊂ C(Q)+ agisce per moltipicazione e poiche [X, Y ]x = (XY − Y X)x =X(Y x)− Y (Xx) si ha proprio una rappresentazione.

Page 181: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 181

Questa rappresentazione non e irriducibile in generale, perche dato un qualunque z ∈ C(Q)+

si ha (Xx)z = X(xz) e quindi l’applicazione lineare C(Q)+ → C(Q)+, x 7→ xz, commuta conla rappresentazione di so(n).

Nel caso K = C la decomposizione della rappresentazione di so(Q) = so(n) in rappresen-tazioni irriducibili e data in 10.3.5 e 10.3.6. Per questo si usa l’algebra di Cartan di so(n), vistacome sottospazio di C(Q)+.

In generale, si puo mostrare che Lie(Spin(Q)) = so(Q) ⊂ C(Q)+ e generata dagli elementivw − B(v, w) ∈ C(Q)+, dove v, w variano in V (si veda [FH] 20.1). Si puo anche verificaredirettamente che:

Lie(Spin(Q)) := x ∈ C(Q)+ : x+ x∗ = 0, xv + vx∗ ∈ V ∀v ∈ V .

E’ facile verificare che vw−B(v, w) ∈ Lie(Spin(Q)). Poiche dimSpin(Q) = dimSO(Q), segueche dimLie(Spin(Q)) = n(n − 1)/2 dove n = dimV e che gli eiej − B(ei, ej), dove ei e unabase di V e i < j, sono una base di Lie(Spin(Q)).

In 10.3.3 determiniamo in modo esplicito la base Hi dell’algebra di Cartan h di so(n), vistacome sottospazio di C(Q)+.

10.3.2 L’algebra di Clifford di Q. D’ora in avanti consideriamo sempre la forma quadraticaQ su Cn data da

Q(x) = x1xm + . . .+ xmx2m oppure Q(x) = x1xm + . . .+ xmx2m + x22m+1

se n = 2m e pari oppure n = 2m + 1 e dispari. La forma bilineare B tale che Q(x) = B(x, x)(e quindi 2B(x, y) = Q(x+ y)−Q(x)−Q(y) e data da:

B(x, y) = 12(x1y2 + x2y1 + . . .+ xmy2m + x2mym)

oppure daB(x, y) = 1

2(x1y2 + x2y1 + . . .+ xmy2m + x2mym) + x2m+1y2m+1.

In C(Q) si ha quindi:

e2i = 0, 1 ≤ i ≤ 2m, ejej+m + ejej+m = 1, eaeb + ebea = 0, (|a− b| 6= m)

dove 1 ≤ i, a, b ≤ 2m e 1 ≤ j ≤ m. In piu e2m+1 anticommuta con questi ei e e22m+1 = 1.

10.3.3 L’algebra di Cartan. L’algebra di Cartan di so(n) = so(Q) e generata dalle Hi,1 ≤ i ≤ m dove n = 2m o n = 2m+ 1, con

Hiej = 0, se j 6= i, i+m, Hiei = ei, Hiei+m = −ei+m.

Quindi Hi = γ∗ := (d/dt)γ(t)|t=0 dove γ(t) ∈ SO(n) e dato da

γ : C∗ −→ SO(n), γ(t)ei = tei, γ(t)ei+m = t−1ei+m γ(t)ei = 1 se j 6= i, i+m.

Page 182: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 182

Si noti che sullo spazio due dimensionale W con base ei, ei+m si ha

Q(x1ei + x2ei+m) = x1x2, B(x1ei + x2ei+m, y1ei + y2ei+m) = 12(x1y2 + x2y1),

e γ(t) induce l’applicazione lineare seguente su W , dove scegliamo un s ∈ C∗ con s2 = t:

γ(s2) =

(s2 00 s−2

)=

(0 −1−1 0

)(0 −s−2

−s2 0

)= RvRw, v =

(11

), w =

(s−1

s

),

dove t = s2 e si ha Q(v) = Q(w) = 1, come si verifica facilmente. Su W⊥ sia γ(t) sia RvRw

sono l’identita, quindi si ha x(t) = RvRw su V = Cn. Poiche x∗ = −x per x ∈ V si ha(vw)∗ = (−w)(−v) = wv e (vw)(vw)∗ = vwwv = vQ(w)v = Q(w)Q(v) = 1, quindi

vw = (ei + ei+m)(s−1ei + sei+m) = s−1eiei+m + sei+msi = s−1 + (s− s−1)eiei+m ∈ Spin(Q),

qui abbiamo usato e2i = e2

i+m = 0 e eiei+m + ei+mei = 2B(ei, ei+m) = 1.Definiamo un cammino

γ : C∗ −→ Spin(n), γ(s) = s−1 + (s− s−1)eiei+m.

Allora si ha:

ρ(γ(s)) = RvRw = γ(s2),γ Spin(n)

C∗ ↓ ργ SO(n),

quindi γ e un sollevamento del cammino γ a Spin(n). Si noti che ρ e 2:1 su γ(C∗) ma che C∗e connesso, quindi anche Spin(n) e connesso.

L’inclusione so(n) ⊂ C(Q)+ e definita tramite l’inverso dell’omomorfismo (dρ)1 :T1Spin(n) → so(n). In particolare, X ∈ T1Spin(n) corrisponde con Hi ∈ so(n) se e solose (dρ)1(X) = Hi.

Un cammino γ definisce un vettore tangente γ∗ (si veda 4.3.3) e si ha (si veda 4.3.5)

(dρ)1(γ∗) = (ρ γ)∗ = γ∗.

In particolare,

γ∗ = (d/ds)γ(s)|s=1 = −1 + 2eiei+m (∈ so(n) ⊂ C(Q)+)

e la sua immagine mediante (dρ)1 in so(n) e:

(dρ)1(γ∗) = (d/ds)γ(s2)|s=1 = 2(d/dt)γ(t)|t=1 = 2Hi

quindi si haHi = 1

2γ∗ = −1

2+ eiei+m (∈ so(n) ⊂ C(Q)+).

10.3.4 Vettori peso in C(Q). Adesso determiniamo alcuni vettori peso in CQ) per h ⊂C(Q)+. Per i ≤ m si ha in C(Q) (si veda 10.3.2):

(eiei+m)ei = ei(−eiei+m + 1) = ei, (eiei+m)ej = ej(eiei+m) (j 6= i, i+m).

Page 183: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 183

Usando cio si trova in C(Q), per ogni i, 1 ≤ i ≤ m:

Hi(e1e2 . . . em) = (−12

+ eiei+m)(e1e2 . . . em) = −12(e1e2 . . . em) + e1e2 . . . em = 1

2e1e2 . . . em.

I pesi Li : h∗ → C soddisfano Li(Hj) = δij. Quindi e1e2 . . . em e un vettore peso per h:

H(e1e2 . . . em−1em) = λm(H)e1e2 . . . em−1em, λm = 12(L1 + . . .+ Lm).

In modo simile, si verifica:

H(e1e2 . . . em−1e2m) = 12(L1 + . . .+ Lm−1 − Lm)(H)(e1e2 . . . em−1e2m).

Per ogni z ∈ C(Q), si trova nello stesso modo:

H(e1 . . . emz) = 12(L1 + . . .+ Lm)(H)e1 . . . emz,

e similmente

H(e1 . . . em−1e2mz) = 12(L1 + . . .+ Lm−1 − Lm)(H)e1 . . . em−1e2mz.

10.3.5 Le rappresentazioni spinoriali di so(2m). Si ricordi che le rappresentazionispinoriali di so(2m) sono le rappresentazioni irriducibili con peso dominante

λm−1 = 12(L1 + . . .+ Lm−1 − Lm), λm = 1

2(L1 + . . .+ Lm),

si veda 9.4.3.Consideriamo la rappresentazione di so(2m) ⊂ C(Q)+ su C+(Q) di 10.3.1. Supponiamo

prima che m sia pari. In questo caso

x = e1 . . . em, y = e1 . . . em−1e2m

sono in C(Q)+ e sono vettori pesi con peso λm e λm−1 rispettivamente. Per

J ⊂ m+ 1, . . . , 2m, K ⊂ m,m+ 1, . . . , 2m− 1 con ]J, ]K ≡ 0 mod 2,

i vettori xeJ e yeK sono vettori peso indipendenti in C+(Q) con lo stesso peso λm e λm−1

rispettivamente. Quindi la moltiplicita di questi pesi e almeno:

dimC(Q)+λm−1

, dimC(Q)+λm≥ 2m−1.

Ogni peso λ nell’orbita di λm−1 o λm sotto il gruppo di Weyl ha la stessa moltiplicita, e ci sono2m−1 pesi in ognuna delle due orbite (si veda 9.4.3). Quindi ognuno dei 2m−1 + 2m−1 = 2m pesinell’unione delle orbite di λm−1 e λm ha moltiplicita almeno 2m−1. La somma diretta di questispazi peso ha allora dimensione almeno 2m2m−1 = 22m−1 = dimC(Q)+. In particolare, ognipeso di h su C+(Q) e nell’orbita di Weyl di λm−1 o λm e percio

C(Q)+ ∼= (V (λm−1) ⊕ V (λm))2m−1

.

Page 184: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 184

Lo stesso isomorfismo vale se m e dispari. In tal caso x, y ∈ C(Q)−, pero per ogni J,K comecome sopra, con ]J, ]K ≡ 1 mod 2, i vettori xeJ e yeK sono vettori peso in C(Q)+. Quinditroviamo ancora almeno 2m−1 vettori pesi indipendenti in C(Q)+

λm−1e C(Q)+

λme si ottiene

l’isomorfismo desiderato.

10.3.6 La rappresentazione spinoriale di so(2m+ 1). Si ricordi che la rappresentazionespinoriale di so(2m+ 1) e la rappresentazione irriducibile con peso dominante

λm = 12(L1 + . . .+ Lm),

si veda 9.5.3. Se m e pari allora per ogni J ⊂ m + 1, . . . , 2m + 1 con ]J pari, il vettoree1 . . . emeJ sta in C(Q)+ e ha peso λm. Se invece m e dispari, il vettore e1 . . . emeJ con ]Jdispari sta in C(Q)+. In entrambi i casi troviamo che

dimC(Q)+λm≥ 2m.

Poiche ogni peso nell’orbita del gruppo di Weyl di λm ha la stessa moltiplicita, e ce ne sono 2m

di tali pesi (si veda 9.5.3), la somma diretta di questi spazi ha dimensione almeno 2m2m = 22m.Poiche dimC(Q)+ = 2n−1 = 22m concludiamo

C(Q)+ ∼= (V (λm))2m .

10.3.7 Isomorfismi di algebre. Nel caso n = 2m, l’isomorfismo C(Q)+ ∼=(V (λm−1)⊕ V (λm))2m−1

implica che

Homso(2m)(C(Q)+, C(Q)+) ∼= M2m−1(C)×M2m−1(C).

Si noti che dimHomso(2m)(C(Q)+, C(Q)+) = 2 · 22(m−1) = 22m−1.D’altra parte, per ogni z ∈ C+(Q) l’applicazione lineare C(Q)+ → C(Q)+, y 7→ yz sta in

Homso(2m)(C(Q)+, C(Q)+) (perche x ∈ so(n) ⊂ C(Q)+ agisce per y 7→ xy). Per ottenere unomomorfismo di algebre, definiamo

φ : C(Q)+ −→ Homso(2m)(C(Q)+, C(Q)+), z 7−→ [x 7→ xz∗]

allora φ(yz)(x) = x(yz)∗ = (xz∗)y∗ = (φ(y) φ(z))(x), quindi φ e un omomorfismo di algebre.Visto che 1 ∈ C(Q)+ e 1z = z, φ e iniettiva. Dato che dimC(Q)+ = 2n−1 = 22m−1 concludiamo

C(Q)+ ∼= M2m−1(C)×M2m−1(C) (n = 2m).

In modo simile si trovaC(Q)+ ∼= M2m(C), (n = 2m+ 1).

Si noti che Spin(Q) ⊂ (C(Q)+)× = M2m(C)× = GL(2m,C) e questa inclusione e unarappresentazione di Spin(Q) su C2m , che induce la rappresentazione spinoriale di so(2m + 1)su C2m ∼= V (λm). In modo simile si ottengono le rappresentazioni spinoriali di so(2m).

Page 185: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

10 RAPPRESENTAZIONI DI SPIN 185

10.4 SpinoriVediamo ora alcune definizioni di uso comune nel linguaggio fisico.

10.4.1 Spinori di Dirac. Sia Q una forma quadratica non-degenere su Cn. In 10.3.7 abbiamotrovato gli isomorfismi di algebre complesse C(Q)+ ∼= M2m−1(C) × M2m−1(C) se n = 2m eC(Q)+ ∼= M2m(C) se n = 2m + 1. In particolare, se n = 2m o 2m + 1, l’algebra di Cliffordpari agisce su C2m e questo induce le rappresentazioni spinoriali di so(2m) e so(2m+ 1).

Gli elementi dello spazio C2m sono detti spinori di Dirac. Il gruppo Spin(Q) ⊂ (C(Q)+)∗

agisce sugli spinori di Dirac.

10.4.2 Spinori di Weyl. Nel caso che n = 2m sia pari, gli elementi dei due sottospazi, didimensione 2m−1 invarianti per C(Q)+ ∼= M2m−1(C) ×M2m−1(C) si chiamano spinori di Weyl.In particolare, in questo caso ogni spinore di Dirac e una coppia di spinori di Weyl.

10.4.3 Spinori di Majorana. La forma quadratica Qr,s, con r+ s = n, su Rn, definisce unaforma quadratica non-degenere Q su Cn (data dallo stesso polinomio x2

1 + . . . + x2p − (x2

p+1 +. . . + x2

n)). Quindi si ha C(r, s)+ := C(Qr,s)+ → C(Q)+. In generale pero non e vero che

C(r, s)+ ∼= M2m−1(R)×M2m−1(R) se n = 2m e C(Q)+ ∼= M2m(R) se n = 2m+ 1. Per esempio,C(0, 3)+ ∼= H, un corpo (si veda 10.2.3) e C(1, 3)+ ∼= M2(C).

Nel caso in qui esista un sottospazio reale V , di dimensione reale 2m, di C2m che sia invarianteper l’azione di C(r, s)+ si dice che gli elementi di V sono spinori di Majorana. Per esempioC(1, 3)+ ∼= M2(C) e in questo caso esiste un tale V : si noti che A + Bi ∈ M2(C), con A,B ∈M2(R) agisce su R4 nel modo seguente

M2(C) → M4(R), A+Bi 7−→(

A B−B A

).

10.4.4 Spinori di Majorana-Weyl. Nel caso n = 2m, e se esiste anche uno spazio vettorialeV di spinori di Majorana ci si puo inoltre chiedere se esistano due sottospazi reale V+, V− di V ,di dimensione reale 2m−1, che siano invarianti per l’azione di C(r, s)+. nel caso affermativo glielementi di V+ e V− sono detti spinori di Majorana-Weyl.

10.4.5 Esistenza di spinori dei vari tipi per C(1, s)+. Nella tabella qui sotto si dal’esistenza o meno di spinori dei vari tipi per C(1, s)+ (∼= C(s, 1)+, si veda 10.2.2). Il risultatodipende soltanto da n = 1 + s mod 8.

n mod 8 0 1 2 3 4 5 6 7Majorana sı sı sı sı sı no no no

Majorana-Weyl no no sı no no no no no

Naturalmente gli spinori di Dirac esistono sempre.

Page 186: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 186

11 Strutture geometriche

Testi consigliati: [dC], [D], [DNF1], [DNF2], [KN], [N1], [N2] [T], [Wa].

11.1 Fibrati

Nel capitolo 4 e stato introdotto il concetto di fibrato tangente che e poi stato generalizzato adalcuni altri casi quali il fibrato cotangente o i fibrati ottenuti dai prodotti tensori o dai prodottiesterni. Tali concetti possono essere ulteriormente generalizzati per permettere la consider-azione di situazioni piu generali che risultano frequenti anche nelle applicazioni fisiche. Infattiabbiamo finora visto i campi vettoriali su una varieta M come sezioni del fibrato tangente,ovvero come mappe verticali V : M → TM , πM V := idM . Tuttavia e possibile pensare acampi che in ogni punto hanno valori in spazi piu generali, che possono essere spazi vettoriali,reali o complessi, algebre di Lie ma anche gruppi o varieta differenziali. I concetti fondamen-tali per la costruzione dei fibrati generali sono tutti contenuti nelle proprieta fondamentali delfibrato tangente.

11.1.1 Fibrati vettoriali. Un fibrato vettoriale si indica con Eπ−→M e consiste dei seguenti

ingredienti

• una varieta differenziale n−dimensionale M , provvista di un atlante A = Uα, φαα∈A;

• uno spazio vettoriale su campo K m dimensionale, detto fibra di riferimento;

• una varieta differenziale (n+m)-dimensionale E, detta lo spazio totale del fibrato;

• una mappa differenziabile suriettiva πM : E →M detta proiezione;

• una famiglia di omeomorfismi locali Φα : π−1M (Uα)→ Uα×F tale che Φα(π−1

M (x)) = x×Fper ogni x ∈ Uα,

i quali devono soddisfare

• per ogni x ∈M l’insieme Ex = π−1M (x) deve essere uno spazio vettoriale isomorfo a F . Ex

si chiama fibra su x. Un punto di E sara quindi localmente individuato da una coppia(x, v), x ∈M e v ∈ F ;

• se Uαβ := Uα ∩ Uβ 6= ∅ allora le mappe

Φβ Φ−1α : Uαβ × F → Uαβ × F , (x, v) 7→ (x, gαβ(x)v) ,

dove gαβ : Uαβ → GL(F ) sono mappe differenziabili dette funzioni di incollamento.

La dimensione della fibra e detta anche rango del fibrato. Il fatto che le funzioni di incollamentosi riducano essenzialmente all’azione del gruppo GL(F ) sulle fibre, puo essere interpretato comese l’incollamento degli intorni locali avvenisse attaccando assieme le fibre comuni, cioe se i dueintorni Uα e Uβ hanno intersezione non vuota Uαβ allora si incolla la fibra x × F ⊂ Uα × F

Page 187: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 187

con la fibra x × F ⊂ Uβ × F al variare di x ∈ Uαβ, dopo averle identificate a meno diuna trasformazione lineare in G := GL(F ). In questo senso la struttura del fibrato dipendeessenzialmente dall’azione del gruppo G nell’incollamento delle fibre e per tale motivo esso vienechiamato il gruppo di struttura del fibrato. Talvolta scriveremo (E, π,M,G, F ) per mettere inevidenza anche il gruppo di struttura.Piu in generale, dato un atlante per M e uno spazio vettoriale F , si chiamano funzioni diincollamento una famiglia di applicazioni

gαβ : Uαβ −→ GL(F ) ,

tali chegαβ(x) = gβα(x)−1 ,

egαβ(x)gβγ(x)gγα(x) = I ∈ GL(F ) ,

per ogni α, β, γ tale che Uαβγ := Uα ∩ Uβ ∩ Uγ 6= ∅. Nella seconda condizione naturalmente lemappe si intendono tutte ristrette a Uαβγ. Essa viene detta anche relazione di cociclo. Dallemappe di incollamento possiamo quindi ricostruire il fibrato vettoriale tramite la relazione

E =

(∐α

(Uα × F )

)/ ∼ ,

dove (x, v) ∈ Uα × F e (y, w) ∈ Uβ × F sono equivalenti se

x = y ∈ Uαβ e w = gαβv .

11.1.2 Esempio. Un esempio di fibrato vettoriale e il fibrato tangente con E = TM , F = Rn

e G = GL(n,R). Vediamo allora che l’elemento gαβ nel caso del fibrato tangente non e altroche la matrice jacobiana J ∈ GL(n,R) della mappa φβ φ−1

α indotta dalle carte locali (Uα, φα) e(Uβ, φβ). Confrontando con quanto visto in 3.1 ed utilizzando le convenzioni introdotte in 1.2.4si puo dunque interpretare l’inversa di J come la matrice di cambiamento di riferimento nellafibra fissata (che dunque agisce a destra), cosicche le componenti (controvarianti) del vettorev ∈ Rn trasformano appunto con la matrice J . In altre parole, nel linguaggio del paragrafo1.2.6, il gruppo di struttura individua il gruppo rispetto al quale i vettori (e piu in generale itensori) si comportano come tali.

11.1.3 Esempio. Il fibrato banale. Un fibrato vettoriale si dice banale se E = M × F . Intal caso la proiezione sul fibrato coincide con la proiezione sul primo fattore.

11.1.4 Il punto di vista fisico. La proprieta di incollamento e particolarmente importantenelle applicazioni fisiche. Nelle trattazioni piu elementari di fisica un campo vettoriale in unacerta regione U viene trattato semplicemente come una mappa V : U → Rn. Il grafico di talemappa e l’insieme delle coppie (x, V (x)) ∈ U × Rn sicche possiamo rivedere il campo come

Page 188: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 188

un’applicazione V : U → U × Rn che composta con la proiezione sul primo elemento si riduceall’identita. Tale descrizione e dunque rigorosa finche ci si riduce ad una regione limitata (cioeuna descrizione locale) in quanto TM |U ' U × Rn, ma non e piu corretta per una definizionedel campo vettoriale su tutta la varieta M , a meno che non si abbia TM 'M×Rn. Un fibratosiffatto si dice banalizzabile e la mappa che realizza tale isomorfismo si dice banalizzazione delfibrato. Il fatto che in generale i fibrati siano non banali dimostra la loro importanza in fisica.Per esempio si dimostra che per le sfere si ha TSn ' Sn × Rn solamente per n = 1, 3, 7.D’altra parte la descrizione locale continua ad essere indispensabile in quanto la descrizionefisica sperimentale non puo avvenire altrimenti. L’apparato sperimentale e l’interpretazionerelativa dei dati per la definizione fisica del campo richiede essenzialmente l’dentificazione localedel fibrato con un prodotto cartesiano: nella regione U in cui si effettuano le misure, i vettorimisurati vengono tutti individuati con elementi di un unico spazio vettoriale Rn e non di undifferente spazio vettoriale (fibra) per ogni punto. Dal punto di vista fisico quindi il fibratoviene costruito necessariamente a pezzi, che vanno poi incollati per costruire il fibrato completo(e dunque la teoria generale). Tale ruolo viene svolto dalle funzioni di incollamento.

11.1.5 Isomorfismo tra fibrati. Due fibrati vettoriali Eiπi−→M , i = 1, 2 si dicono isomorfi

se esiste un diffeomorfismo f : E1 −→ E2 che ristretto alle fibre si riduce ad un isomorfismo traspazi vettoriali e che sottende l’identita sulla base, cioe π2 f = π1. In altre parole una fibrasul punto x viene mandata nella fibra sullo stesso punto.Un fibrato si dice banalizzabile se e isomorfo ad un fibrato banale.

11.1.6 Esempi. Un esempio di fibrato banale e il cilindro, visto come fibrato di rette sulcerchio S1 situato nell’origine delle rette stesse. Un fibrato banalizzabile, come visto nel capitolo4, e il fibrato tangente sul cerchio S1. Un fibrato non banalizzabile e invece il nastro di Mobiusanch’esso visto come fibrato vettoriale su S1. Dato un fibrato, la sua restrizione ad una cartalocale opportuna e per definizione un fibrato banalizzabile e si dimostra in realta che e banale,cioe tutti i possibili isomorfismi sono equivalenti.

11.1.7 Sezioni di un fibrato. Dato un fibrato Eπ−→ M si chiamano sezioni o sezioni

trasversali del fibrato le mappe differenziabili

ψ : M −→ E ,

che soddisfano π ψ = idM . Si scrive ψ ∈ Γ(M,E). In particolare si dice che ψ e una sezioneglobale se e definita su tutto M . Si dice invece che e locale se e definita solamente su un intornoaperto U in M e si scrive ψ ∈ Γ(U,E).Queste definizioni sono vere anche per fibrati piu generali di quelli vettoriali (si veda piu avanti).

11.1.8 Criterio di banalizzabilita. Non e difficile dimostrare che un fibrato vettoriale confibra m−dimensionale e banalizzabile se e soltanto se ammette l’esistenza di m sezioni globaliovunque linearmente indipendenti (esercizio). In pratica la scelta di un riferimento di sezioniglobali idividua un isomorfismo con il fibrato M × F . Tuttavia, dati due riferimenti, non e

Page 189: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 189

detto che sia possibile deformare l’uno nell’altro con continuita tramite una famiglia continuadi riferimenti.

11.1.9 Prodotto fibrato e prodotto tensoriale di fibrati vettoriali. Siano E1π1−→M e

E2π2−→M due fibrati vettoriali su M con fibre F1 ed F2. Si costruisce allora il prodotto fibrato

E1 ×M E2π×−→M su M , con fibra F1 × F2 dove lo spazio totale e

E1 ×M E2 := (ξ1, ξ2) ∈ E1 × E2 |π1ξ1 = π2ξ2 .

In modo del tutto analogo si costruisce il prodotto tensore E1 ⊗M E2π⊗−→ M su M , con fibra

F1 ⊗ F2 dove lo spazio totale e

E1 ⊗M E2 := ξ1 ⊗ ξ2|(ξ1, ξ2) ∈ E1 × E2 e π1ξ1 = π2ξ2 .

Un modo piu semplice di definire tali fibrati e attraverso le funzioni di incollamento. Indichiamocon g

(i)αβ : Uαβ −→ GL(Fi), i = 1, 2 le funzioni di incollamento dei due fibrati. Per il prodotto

fibrato, di fibra F1 ⊕ F2, avremo

E1 ×M E2 =

(∐α

Uα × (F1 ⊕ F2)

)/ ∼ ,

dove la relazione di equivalenza e

(x, (v, w)) ∼ (x, (g(1)αβ (x)v, g

(2)αβ (x)w)) , ∀x ∈ Uαβ, v ∈ F1, w ∈ F2 .

Analogamente per il prodotto tensore, di fibra F1 ⊗ F2, avremo

E1 ⊗M E2 =

(∐α

Uα × (F1 ⊗ F2)

)/ ∼ ,

dove la relazione di equivalenza e l’estensione lineare di

(x, v ⊗ w) ∼ (x, g(1)αβ (x)v ⊗ g(2)

αβ (x)w) , ∀x ∈ Uαβ, v ∈ F1, w ∈ F2 .

E ovvio come tali definizioni si estendano al caso di un numero arbitrario di fibrati.

11.1.10 Duale di un fibrato vettoriale. Dato un fibrato vettoriale Eπ−→ M di fibra F

si puo costruire il suo duale E∗ semplicemente sostituendo ogni fibra Ex ' F con il suo dualeE∗x. Usando le funzioni di struttura come sopra, vediamo che

E∗ =

(∐α

Uα × (F ∗)

)/∼∗ ,

dove ∼∗ e definita dalla rappresentazione controgradiente di GL(F ) su F ∗.

Page 190: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 190

11.1.11 Fibrati principali. Finora abbiamo individuato il gruppo di struttura di un fi-brato vettoriale con fibra F con il gruppo GL(F ). Tuttavia piu in generale puo accadere chele funzioni di incollamento abbiano valori in un sottogruppo G ⊂ GL(F ). L’importanza delruolo del gruppo di struttura G nella costruzione dei fibrati vettoriali suggerisce di introdurreil seguente concetto.Un fibrato principale con gruppo di struttura G e una quadrupla P , πM ,M,G (che in generale

indicheremo semplicemente con P o con P πM−→ M) dove P ed M sono due varieta differen-ziabili, πM : P → M un’applicazione differenziabile suriettiva, G un gruppo di Lie che agisceliberamente a destra su P , preservando ciascuna fibra Px := π−1

M (x) e l’azione e transitiva sullefibre. Infine si richiede che esistano degli omeomorfismi locali che banalizzino localmente ilfibrato e che siano compatibili con l’azione di G:

Φα : π−1M (Uα) −→ Uα ×G tale che Φα(Px) = x ×G, Φα(pg) = Φα(p)g

dove (x, h)g := (x, hg) per x ∈ Uα e g, h ∈ G.In particolare dunque Px ' G e (ΦβΦ−1

α )(x, h) = (x, gαβ(x)h) per una mappa differenziabilegαβ : Uαβ → G. Poiche tali funzioni devono chiaramente soddisfare le relazioni di cociclo(si veda 11.1.1) come vedremo da un fibrato principale si puo sempre costruire un fibratovettoriale. Si noti che la richiesta che le Φα rispettino l’azione a destra impone che esso definiscaessenzialmente un’azione a sinistra sulle fibre. In sostanza possiamo scrivere

P =

(∐α

Uα ×G

)/ ∼ ,

dove(x, h) ∼ (x, gαβ(x)h) , ∀x ∈ Uαβ, h ∈ G .

Un esempio di fibrato principale, di particolare importanza in relativita generale, e il fibratodei riferimenti.

Nota. Una sezione di un fibrato principale si dice globale se e ovunque ben definita. Allora unfibrato principale e banalizzabile se e solo se ammette almeno una sezione globale.

11.1.12 Il fibrato dei riferimenti. Il fibrato dei riferimenti puo essere definito per ognifibrato vettoriale. Tuttavia, per motivi di definitezza e per il significato che assume in relativitagenerale, ci concentriamo qui nel caso del fibrato tangente. Sia

πM : TM −→M

il fibrato tangente a M . Ad ogni x ∈M , anziche uno spazio vettoriale TxM , si associ l’insiemedei riferimenti18 in TxM , che denoteremo con RxM . RxM non e uno spazio vettoriale ma eun sottoinsieme aperto di Rn2

e quindi una varieta dfferenziale n2−dimensionale. Su di essavi e un’azione19 libera e transitiva di GL(n,R) il quale risulta percio isomorfo (come varieta)

18cioe n-uple di vettori linearmente indipendenti, n = dimM , cioe una base ordinata19a destra secondo le convenzioni in 1.2.4

Page 191: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 191

alla fibra stessa, una volta che si sia identificato un punto e ∈ RxM con l’elemento neutroI ∈ GL(n,R). Sull’insieme

RM :=∐p∈M

RpM ,

e le sue restrizioni RM |Uα :=∐

p∈UαRpM agli intorni delle carte locali (Uα, φα), si vede che laprecedente identificazione individua degli omeomorfismi locali

Ψα : π−1M (Uα) ≡ RM |Uα −→ Uα ×GL(n,R) ,

i quali danno a RM la struttura di una varieta differenziale ((n2 + n)−dimensionale). Qui πMe la proiezione naturale che associa x ∈M ad ogni fibra RxM .L’oggetto cosı costruito si chiama il fibrato dei riferimenti su M . Esso e costituito dauna quadrupla RM,πM ,M,GL(n,R) dove RM ed M sono due varieta differenziabili,πM : RM → M un’applicazione differenziabile suriettiva e il gruppo di Lie GL(n,R) agisceliberamente e transitivamente a destra su RM preservando le fibre.

11.1.13 Fibrati vettoriali associati ad un fibrato principale. Sia P un fibrato principaledi gruppo G e (ρ, F ) una rappresentazione di G sullo spazio vettoriale F (finito-dimensionale).Si puo costruire un fibrato vettoriale

E = P ×G FπE−→M

con gruppo di struttura G ponendo

E = P ×ρ F := (P × F )/∼ρ ,

dove la relazione di equivalenza e data da

(p, h) ∼ρ (pg, ρ(g−1)v) , ∀p ∈ P , g ∈ G, v ∈ F .

Se con ∼P indichiamo la relazione di equivalenza che definisce P , abbiamo

E =

((∐α

Uα ×G

)/ ∼P

)×ρ F .

Dunque se (x, h, v)((x, h), v) e un rappresentante di un punto di E e se gαβ sono le funzioni ditransizione di P , si ha

(x, h, v) ∼ρ (x, e, ρ(h)v) ∼P (x, gαβ(x), ρ(h)v) ∼ρ (x, e, ρ(gαβ(x))ρ(h)v) ,

dove e e l’identita del gruppo. Poiche la mappa v 7−→ (e, v) definisce un isomorfismo tra G×ρVe V , possiamo scrivere la catena di equivalenze nella forma (dove in questo caso particolarew ' (e, w) ' (h, v))

(x,w) ∼E (x, ρ(gαβ(x))w) ,

Page 192: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 192

cosicche

E =

(∐α

Uα × F

)/ ∼E .

In altre parole, se gαβ sono le funzioni di transizione di P , allora le funzioni di transizione delfibrato vettoriale associato sono le ρ(gαβ).

11.1.14 Esempio. Il fibrato tangente. Il fibrato tangente e il fibrato vettoriale associatoal fibrato dei riferimenti, dove V = Rn (n = dim(M)) e se A e una matrice di GL(n,R) alloraρ(A) agisce su Rn semplicemente con l’usuale prodotto riga per colonna della matrice A per ivettori colonna di Rn. Infatti possiamo costruire esplicitamente la mappa che lega il fibrato deiriferimenti al fibrato tangente

Φ : R× Rn −→ TM , (r, v) 7−→n∑i=1

fiai ∈ TxM ,

dove r = (f1(x), . . . , fn(x)) ∈ Rx e un riferimento in x e v = (a1, . . . , an) ∈ Rn una n-uplareale. Il gruppo GL(n,R) agisce a destra sui riferimenti in modo che se A ∈ GL(n,R), allora

RAr = r = (f1, . . . , fn) , fi =n∑j=1

fjAji .

Allora ρ(A−1) e la matrice inversa di A che agisce a destra nella trasformazione dei riferimenti,cioe

ρ(A−1)v = v = (a1, . . . , an), ai =n∑j=1

(A−1)ijaj .

Infatti in tal modo gli elementi (r, v) e (r, v), che sono ρ equivalenti, vengono mappati nellostesso elemento di TM :

Φ(r, v) =n∑i=1

n∑j=1

n∑k=1

fiAij(A−1)jka

k =n∑i=1

n∑k=1

fiδikak =

n∑i=1

fiai = Φ(r, v) .

Questo, oltre a mostrare esplicitamente come il fibrato vettoriale venga realizzato tramite leclassi di equivalenza, mette in evidenza come in pratica la relazione tra fibrato principale e fi-brato vettoriale sia una generalizzazione della relazione tra vettori, componenti e basi descrittanel capitolo 1.Il fibrato cotangente si ottiene allo stesso modo sostituendo a ρ la sua rappresentazionecontrogradiente. Piu in generale si puo usare 3.1 per definire i fibrati tensoriali.

11.1.15 Osservazioni. Si puo generalizzare ulteriormente il concetto di fibrato. Cio cheoccorre sono

• tre varieta differenziabili E,M,F con dim(E) = dim(M)+dim(F ), dette rispettivamentespazio totale, base e fibra di riferimento;

Page 193: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 193

• una mappa differenziabile suriettiva πEM : E →M ;

• associata ad un atlante (Uα, φα)α∈A di M , una famiglia di omeomorfismi locali ΨEα :

(πEM)−1(Uα)→ Uα × F ;

• un gruppo di struttura G che agisce su F e tale cioe che ΨEβ (ΨE

α )−1((p, f)) = (p, gαβf)se p ∈ Uα ∩ Uβ e f ∈ F mentre gαβ ∈ G.

Si definisce cosı un fibrato differenziale E su M con fibra F e gruppo di struttura G.Si noti ancora una volta che le funzioni di incollamento gαβ devono soddisfare le condizioni dicociclo

g−1αβ = gβα , gαβgβγgγα = idUαβγ ,

essendo Uαβγ = Uα ∩ Uβ ∩ Uγ.Tutte le precedenti definizioni sono casi particolari di questa, dove in particolare F = G nelcaso di un fibrato principale.Si vede inoltre facilmente che ogni fibrato sottende sempre un fibrato principale. Nellacostruzione di tutti i possibili fibrati, la fibra non ha quindi particolare importanza dato chetutti i fibrati possono essere ricondotti al fibrato principale sotteso. Di qui la particolare impor-tanza dei fibrati principali: per classificare tutti i fibrati differenziali su una varieta e sufficienteclassificarne i possibili fibrati principali.

11.1.16 Esempio: fibrati sulla sfera. Se consideriamo M = Sn, la sfera n-dimensionalecon l’usuale struttura differenziale individuata ad esempio dall’immersione in Rn+1, come notosi puo utilizzare un atlante costituito da due sole carte locali, diciamo una che copre l’emisferoboreale

S+ = x = (x0, . . . , xn) ∈ Rn+1|x · x = 1, x0 > −ε ,

e l’altra che copre l’emisfero australe

S− = x = (x0, . . . , xn) ∈ Rn+1|x · x = 1, x0 < ε ,

che si intersecano in un intorno (piccolo a piacere) della sfera equatoriale Se = S+∩S− = Sn−1.Ogni fibrato sulla sfera e quindi individuato da una sola funzione di transizione, essenzialmentege : Se −→ GL(n,R). Per classificare tutti i fibrati (o meglio le loro classi di equivalenza) sullasfera Sn, occorre classificare le mappe Sn−1 −→ GL(n,R) (o meglio le loro classi di omotopia).

11.1.17 Osservazione. Notiamo infine che puo essere utile talvolta utilizzare la seguente

Page 194: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 194

raffigurazione pittorica per un fibrato E :π−→M con fibra F

Fibrato differenziale

s

s

sI

x = π(ξ)

ξψ

v = ψ(ξ)

E F

M

Ex

11.2 Geometria e gruppi di Lie

Vediamo alcuni aspetti della geometria dei gruppi di Lie dal punto di vista delle varietadifferenziali. Sia dunque G un gruppo di Lie n−dimensionale.

11.2.1 La 1−forma di Cartan. Come si e visto in 5.2.1 su G e definita una mappa Lg ditraslazione a sinistra, che permette di definire l’algebra di Lie associata al gruppo come l’algebradei campi vettoriali invarianti a sinistra ed identificarla con lo spazio tangente all’identita. Unabase di campi vettoriali invarianti a sinistra e data da χini=1 dove χi|g = Lg∗τi, essendo τi glielementi di una base di TeG. Similmente se µj individuano la base duale di T ∗eG, µi(τj) = δij,allora la base delle 1−forme invarianti a sinistra (canonicamente duale a quella dei campi) edata da J i|g = L∗g−1(µi). Si definisce allora la forma di Cartan J := τiJ

i, che per costruzione edunque una 1−forma a valori nell’algebra di Lie che risulta essere invariante a sinistra. Poichei τ si possono identificare con χi si vede che la forma di Cartan agisce come l’identita sui campiinvarianti a sinistra. In particolare dunque J e indipendente dalla scelta della base τi. Infine eun utile esercizio la dimostrazione della importante proprieta R∗gJ = Ad(g−1) J .

11.2.2 La forma di Killing. Sull’algebra di Lie g si definisce una forma bilineare K :g × g → C, detta forma di Killing, tramite la relazione K(a, b) = Tr(ad(a)ad(b)) per ognia, b ∈ g, dove Tr indica la traccia. Essa soddisfa le proprieta di simmetria K(a, b) = K(b, a) edi ad-invarianza K([a, b], c) = K(a, [b, c]), che segue facilmente dalle identita di Jacobi. Posto

Page 195: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 195

Kij = K(τi, τj) si puo scrivere K = Kijµi ⊗ µj. La forma di Killing si estende facilmente ad

una forma bilineare simmetrica ad-invariante

KG ∈ T ∗G⊗S T ∗G := Sym2(T ∗G)

tramite pull-back: KG|g = L∗g−1K. Dunque KG = Tr(ad(J)⊗ ad(J)) = KijJi⊗ J j e invariante

a sinistra.Si noti che scelta una base τj dell’algebra, con costanti di struttura c l

jk e con base duale µj, siha

Kij = Tr(ad(τi) ad(τj)) =n∑l=1

µl((ad(τi) ad(τj))(τl)) =n∑

l,k=1

µl([τi, ck

jl τk])

=n∑

l,k,s=1

c kil c

sjk µ

l(τs) ,

sicche, adottando la convenzione di Einstein, Kij = c kil c

ljk . Inoltre la condizione di ad-

invarianza assume la forma c lij Klk = −c l

ik Klj che equivale a dire che i coefficienti cijk := c lij Klk

sono completamente antisimmetrici negli indici.

11.2.3 L’equazione di Maurer-Cartan. Vogliamo calcolare d1J ovvero d1J i. Poiche leJ i sono invarianti a sinistra e, come si dimostra facilmente, l’operatore di derivazione esternacommuta con il pull-back, le due forme d1J i saranno anch’esse invarianti a sinistra. Per deter-minarle e dunque sufficiente valutarle sulla base χj di campi invarianti a sinistra. Utilizzandola formula di Cartan in 4.5.8 e il fatto che J i(χj) = δij, si ottiene

dJ i(χj, χk) = −J i([χj, χk]) = −c ljk J

i(χk) = −c ijk ,

essendo c ljk le costanti di struttura dell’algebra nella data base: [τj, τk] = c l

jk τl. Segue che

dJ = 12J j ∧ Jkc l

jk τl, che si trova talvolta scritta nella forma

dJ +1

2[J, J ] = 0

dove si intende convenzionalmente che per due 1-forme J,K a valori in un’algebra di Lie

[J,K](χ, ξ) := [J(χ), K(ξ)]− [J(ξ), K(χ)] ,

cosicche [J, J ] := [τi, τj]Ji ∧ J j.

11.2.4 Forma di Killing per gruppi semisemplici. Si dimostra che K e non degenere see soltanto se l’algebra g e semisemplice. Ricordiamo che nondegenere significa che K(a, b) = 0∀b ∈ g implica a = 0 (l’analogo scambiando a con b segue dalla simmetria), che equivale adetKij 6= 0.Dimostriamo che se K non e degenere allora g e semisemplice. Per assurdo sia I ⊂ g un ideale

Page 196: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 196

abeliano non banale. Allora K(I, g) = 0 cioe K(i, a) = 0 per ogni i ∈ I, a ∈ g. Infatti, sceltala base τi di g e la sua duale µj, sia ha K(i, a) = Tr(ad(i) ad(a)) =

∑nl=1 µ

l([i, [a, τl]]). Ses = dim(I) allora scegliamo la base τi in modo che i primi elementi generino I. Percio

K(i, a) =s∑l=1

µl([i, [a, τl]]) +n∑

l=s+1

µl([i, [a, τl]]) = 0 ,

dato che nella prima sommatoria [a, τl] ∈ I ha parentesi nulle con i (essendo I abeliano) mentrenella seconda sommatoria µl e valutato su I, ma l > s.In particolare dunque KG e nondegenere per i gruppi semisemplici. Se l’algebra di Lie e reale,allora K definisce una metrica con segnatura, che e euclidea nel caso si tratti di una formacompatta. Una metrica invariante a sinistra sul gruppo e percio ds2 = κKG, essendo κ unacostante di normalizzazione.

11.2.5 Esempio. Il caso dei gruppi matriciali. Consideriamo il caso in cui G sia unsottogruppo di Lie di GL(N,C). Sia (U, ψ) una carta locale contenente l’identita e = ψ−1(0).Posto V := ψ(U) ∈ Rn, dove n = dim(G), indichiamo con g(x) = ψ−1(x) il generico punto di Ue sia θ(x) := g(x)−1dg. Si tratta di una 1−forma su V con le seguenti proprieta di immediataverifica:

• θ(0) : T0V → TeG ' g;

• se hg(x) ∈ U allora (Lh ψ−1)∗θ = θ;

• θ(0)(∂/∂xj) = ψ−1∗ (∂/∂xj).

Ne segue che φ := ψ∗θ e una 1−forma U con le proprieta

• φ(e) : TeU → TeG ' g;

• se hg ∈ U allora (Lh)∗φ = φ, cioe e invariante a sinistra;

• φ(e)(τi) = θ(0)(ψ∗(τi)) = τi,

cosicche φ = J |θ e la restrizione a U della forma di Cartan. Per i gruppi matriciali si ha quindiuna costruzione semplice della forma di Cartan che si indica semplicemente con J = g−1dg. Essapermette anche una deduzione elementare dell’equazione di Maurer-Cartan. Poiche g−1 · g = e,si trova che dg−1 = −g−1 · dg · g−1, da cui segue immediatamente che dJ = −J ∧ J . D’altraparte, posto J = J iτi, usando l’antisimmetria del prodotto esterno, si ha J ∧ J = τiτjJ

i ∧ J j =12[τiτj − τjτi]J i ∧ J j = 1

2[τi, τj]J

i ∧ J j, che porta all’equazione di Maurer-Cartan.

11.2.6 Esempio. SU(2). E il gruppo delle matrici 2 × 2 unitarie, UU † = U †U = 1,con detU = 1. Il differenziale di queste relazioni mostra che l’algebra consiste delle matriciantihermitiane di traccia nulla. Una base conveniente e data dalle τi = −iσi, i = 1, 2, 3 con

σ1 =

(0 11 0

), σ2 =

(0 −ii 0

), σ3 =

(1 00 −1

).

Page 197: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 197

Le costanti di struttura sono c lij = 2εijl, cioe due volte il tensore di Levi-Civita. La metrica

di Killing e percio Kij = c lik c

kil = −8δij. E definita negativa ed in particolare nondegenere,

conseguenza della semplicita di su(2).Per individuare l’elemento generico di SU(2) si puo adoperare la parametrizzazione di Eulerog(φ, θ, ψ) = eφσ3eθσ2eψσ3 dove φ ∈ [0, π[, θ ∈ [0, π/2[, ψ ∈ [0, 2π[. Allora si trova per la formadi Cartan20

J = g−1dg = [− cos(2ψ) sin(2θ)dφ+ sin(2ψ)dθ]σ1 + [sin(2ψ) sin(2θ)dφ+ cos(2ψ)dθ]σ2

+[dψ + cos(2θ)dφ]σ3 ,

e quindi per la forma di Killing sul gruppo21

KG = −8[dφ2 + dθ2 + dψ2 + 2 cos(2θ)dφdψ] .

11.2.7 Misura invariante su gruppi semisemplici. In Rn si puo definire una misura diLebesgue dµ(x) = dx1 · . . . · dxn. Sia (M,γ) una varieta dotata di una metrica γ. Scegliamouna carta locale (U, φ) con coordinate x. Si definisce allora una misura τ su U nel seguentemodo: poiche φ e un omeomorfismo, allora V ⊂ U sara misurabile se lo e φ(V ) e poniamo

τ(V ) =

∫φ(V )

√| det γ|dµφ(x) ,

dove γ := φ−1∗. Essa e ben definito poiche√| det γ|dµφ(x) non dipende dalla scelta delle

coordinate22 e√| det γ| e strettamente positivo su φ(U). Inoltre puo essere estesa a tutta M

tramite una partizione dell’unita.Consideriamo allora il caso di un gruppo semisemplice reale. Su di esso la metrica invarianteda origine ad una misura invariante. Infatti sia V ⊂ Z e LgV ⊂ U , dove (Z, ψ) e una secondacarta locale di coordinate y. Allora

τ(LgV ) =

∫φ(LgV )

√| detφ−1∗(KG)|dµφ(x) =

∫ψ(V )

√| detψ−1∗ L∗g−1(KG)|dµψ(y)

=

∫ψ(V )

√| detψ−1∗(KG)|dµψ(y) = τ(V ) .

Giustificazione della misura: in un dato punto e sempre possibile scegliere delle coordinateortogonali per le quali cioe il tensore metrico γ = gijdx

idxj e diagonale. Se in tale sistemaconsideriamo le curve coordinate infinitesime δxi, ciascuna ottenuta variando di ∆xi la cor-rispondente coordinata, esse individuano un cubetto i cui lati sono lunghi |δxi| =

√|gii|∆xi e

20come d’uso omettiamo di mettere in evidenza il fatto che in realta stiamo esprimendo le seguenti quantitain coordinate locali

21usiamo la notazione dx2 := dx⊗ dx e dxdy := dx⊗S dy = 12 (dx⊗ dy + dy ⊗ dx)

22verificare!

Page 198: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 198

che ha dunque volume√| det g|

∏ni=1 ∆xi.

Se sul gruppo usiamo la metrica γ = κKG, allora si ha

gijdxidxj = κKijJ

i ⊗ J j = κKlmJliJ

mj dx

idxj ,

da cui√|detgij| =

√|κ detKij|| det J ij |. La determinazione della misura invariante sul gruppo

si riduce allora essenzialmente al calcolo del determinante della matrice J ij .

11.2.8 Esempio. La misura invariante per SU(2). La matrice associata alla forma diCartan e

J il =

− cos(2ψ) sin(2θ) sin(2ψ) 0sin(2ψ) sin(2θ) cos(2ψ) 0

cos(2θ) 0 1

,

e quindi | det J il | = sin(2θ), che determina l’intera misura se scegliamo ad esempio κ = −18.

Si noti che in questo caso il calcolo della misura si poteva fare direttamente partendo da KG.Tuttavia nel caso generale le difficolta tecniche diventano tali che il calcolo di KG e praticamenteimpossibile mentre il calcolo di J e del suo determinante sono ancora fattibili.

11.3 Connessioni

Dato un fibrato differenziale (E, π,M,G, F ) ha senso introdurre il concetto di campi su M avalori nello spazio vettoriale F . Si trattera delle sezioni ψ ∈ Γ(M ;E), cioe le mappe

ψ : M −→ E , π ψ = idM .

Nasce allora la necessita di introdurre il concetto di derivazione di un tale campo, che estendaquello delle usuali funzioni, e che ammetta pero l’interpretazione di confronto tra i valori delcampo in punti vicini. La difficolta principale e insita nel fatto che ψ(x) ∈ π−1(x) e ψ(y) ∈π−1(y) per x 6= y appartengono a due spazi vettoriali isomorfi ma distinti e percio la lorodifferenza non ha alcun significato. Per poter confrontare i due vettori ψ(x) e ψ(y) occorre inqualche modo trovare il modo di trasportare uno dei due vettori nello spazio vettoriale dell’altro.Bisogna percio in qualche modo connettere i due spazi vettoriali e una volta che si sia stabilitauna tale connessione si puo pensare di trasportare uno dei due vettori da uno spazio vettorialeall’altro. Un tale trasporto viene detto anche trasporto parallelo.

11.3.1 Esempio. Spazi affini. Consideriamo il caso in cui M sia uno spazio affinen−dimensionale reale. Come varieta differenziale M ' Rn. Consideriamo un campo vettorialeψ ∈ X (M) = Γ(M,TM). In questo caso si ha TM ' M × Rn ' R2n. Fissato un puntox ∈ M , si ha l’isomorfismo naturale TMx ' Rn. In pratica, possiamo pensare pittoricamentea TxM come all’insieme dei vettori che spiccano da x e terminano nei punti y di M . Usandole proprieta dello spazio affine, dati i punti x, y ∈ M c’e un modo naturale di trasportare ilvettore ψ(y) in x. Infatti se ψ(y) = z − y per qualche z ∈ M , sia w = x + (z − y). Inpratica x, y, z, w sono i vertici di un parallelogramma. Possiamo allora pensare a w − x comeal trasporto parallelo di ψ(y) in x.

Page 199: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 199

Conviene vedere la regola di trasporto che abbiamo assegnato dal punto di vista del fibrato.Scriviamo TM ' Rn

(1) × Rn(2) e vediamo i due fattori del prodotto come se fossero ascisse ed

ordinate: le ascisse individuano i punti di M ' Rn(1). L’iperpiano individuato da un fissato

valore delle ascisse rappresenta la fibra nel dato punto. Posto ψ(y) = (y, v) il suo trasporto inx e semplicemente (x, v). In altre parole la regola stabilita e la seguente: quando ci si spostada y in x, lungo una qualche curva γ (γ(0) = y, γ(1) = x), corrispondentemente il punto inTM si sposta nell’iperpiano (Rn

(1), v) lungo la curva (γ, v).Questo modo di eseguire il trasporto e banale, ma e reso possibile dal fatto che il fibrato ebanale. Poiche TM 'M ×Rn possiamo trasformare una curva γ in M in una curva γ = (γ, v)in TM ed usarla per eseguire il trasporto: il punto iniziale e quello da trasportare mentre quellofinale e il risultato del trasporto lungo la curva.Per fibrati non banali non e possibile associare alla curva γ ∈ M una curva γ ∈ TM chedetermini il trasporto, in modo altrettanto naturale. Osserviamo inoltre che per Rn la curvanon sembra giocare in realta nessun ruolo, mentre si vede facilmente che il trasporto dipendedecisamente dalla curva nei casi non banali.

11.3.2 Esempio. Connessioni metriche su S2. Naturalmente possiamo pensare S2

immerso in R3 per cui TS2 ⊂ R3×R3, dove R3 e dotato della metrica euclidea. Questa metricainduce una metrica su S2, con la quale si possono misurare le lunghezze e gli angoli tra i vettoritangenti in un punto della sfera. Un trasporto parallelo che conserva tali angoli si dice essereindotto da una connessione metrica. Comunque una volta fissata una metrica la connessionemetrica non e univoca poiche occorre caratterizzare anche le curve rispetto alle quali l’angoloviene conservato. Per chiarire questo punto nel caso di una sfera esiste una rappresentazionepittorica.Connessione di Levi-CivitaSia v ∈ TpS

2 il vettore da trasportare sulla sfera. Possiamo supporre che p sia il polo sud eTpS

2 sia un piano sul quale la sfera e appoggiata. Identificando il piano con lo spazio affineR2 possiamo spostare parallelamente il vettore v ovunque e quindi immaginare che in ogni suopunto vi sia un vettore parallelo a v.Supponiamo di far rotolare la sfera sul piano. La regola e che non ruoti mai su se stessa attornoal punto d’appoggio. Allora man mano che rotola il punto d’appoggio traccia sulla sfera unarco diametrale che mantiene sempre lo stesso angolo rispetto ai vettori fissati sul piano. Sela fermiamo, essa si appoggera nel punto q (sull’arco massimo) e possiamo identificare il pianocon TqS

2. Il vettore in q parallelo a v (sul piano!) puo allora essere identificato con il trasportoparallelo di v in q. Si noti che il vettore unitario tangente alla curva in ogni punto coincide conil trasporto parallelo del vettore unitario tangente in p lungo la curva. Si dice che tale curva eautoparallela.Se vogliamo trasportare lo stesso vettore v lungo una curva arbitraria sulla sfera, potremo diseg-nare la curva sulla sfera, e farla rotolare in modo che poggi sul piano sempre con i punti segnatidalla curva senza mai ruotare rispetto all’asse verticale. Il vettore unitario tangente alla sferalungo la curva arbitraria non coincide con il trasporto parallelo del vettore unitario tangentealla curva in p. Se introduciamo delle coordinate locali xα e se nel punto fissato consideriamouno spostamento cosı breve da essere considerato rettilineo, allora nello spostamento lungo il

Page 200: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 200

trattino di curva dγ, il vettore v = vα ∂∂xα

restera invariato e, se l e la lunghezza d’arco cheparametrizza la curva, avremo dvα

dl= o(dl), cioe si annulla a meno di termini di ordine (dl)2,

essendo dl la lunghezza infinitesima del trattino.Connessione metrica con torsionePossiamo usare la stessa rappresentazione per introdurre un trasporto parallelo piu complicato.Si faccia rotolare la sfera accompagnando il suo movimento con una leggera rotazione attornoal punto d’appoggio, proporzionale di volta in volta allo spostamento (vettoriale) infinitesimodella sfera, in particolare se e ferma non ruota su se stessa, ed eventualmente dipendente dalpunto di appoggio. Se in tali circostanze si vuole che il vettore tangente alla sfera sia trasportatoparallelamente, otterremo una curva in generale diversa da una curva diametrale. Sicche anchequesto trasporto e indotto da una connessione metrica, tuttavia e differente dal precedentepoiche si distingue per le curve autoparallele.Lungo una curva arbitraria, con le stesse convenzioni del caso precedente, avremo dvα

dl=

dγβK αβ γv

γ + o(dl), dove δRαγ = dγβK α

β γ e la matrice di rotazione infinitesima secondo lasuddetta regola. Nel dato punto, l’oggetto a tre indici K α

β γ, che ovviamente dipende dal pun-to e che in funzione della direzione β fornisce la velocita di rotazione della sfera rispetto allalunghezza d’arco di spostamento, definisce dunque un tensore detto contorsione. In questo casosi parla di trasporto parallelo indotto da una connessione metrica con torsione.Da questi esempi si vede che per determinare un trasporto parallelo occorre assegnare unaregola che esprima dvα

dlin funzione di v stesso e della curva considerata. Come osservato in

11.3.1 in effetti il problema di determinare il trasporto parallelo puo essere tradotto in quello diassociare opportunamente alla curva γ una curva γ(l) = (γ(l), v(l)) ∈ TM . Il vettore tangentea tale curva in ogni punto sara allora dγ

dl∈ Tγ(TM). Ora il vettore da trasportare giace sulla

fibra Tγ(l)M e quindi, essendo Tγ(l)(Tγ(l)M) naturalmente contenuto come sottospazio vettorialein Tγ(TM), euristicamente possiamo dire che la velocita di variazione del vettore nel trasporto,dvdl

non e altro che la proiezione di dγdl

sul sottospazio Tγ(l)(Tγ(l)M). Si dice anche che ne e lacomponente verticale.

Spazi orizzontali

s

s

x = π(ξ)

ξ

E F

M

I

lllllllllllll

N

V ∈ TξE

V ′H′

H

V ≡ 0

Ex

Page 201: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 201

Tuttavia, come si vede dal disegno, questa interpretazione diventa significativa solamentese e possibile la determinazione anche di una componente orizzontale che in pratica forniscel’immersione di TγM in Tγ(TM) come spazio degli spostamenti da una fibra all’altra, chenon e affatto naturale. In altre parole e necessario assegnare ad ogni punto ξ ∈ TM unaspazio orizzontale n−dimensionale Hξ che determini una decomposizione diretta Tξ(TM) 'TπM (ξ)M ⊕Hξ. Si noti infatti che l’individuazione di un sottospazio vettoriale di uno spazio Vnon e sufficiente a determinare una decomposizione diretta. Nel disegno vediamo che fissatoun vettore V ∈ TξE, la sua componente verticale V lungo la fibra Ex non e determinataunivocamente dalla conoscenza di TξEx. Occorre specificare anche lo spazio orizzontale! Sescegiamo H come spazio orizzontale allora in particolare V e orizzontale e la sua componentelungo lo spazio tangente alla fibra e nulla. Se invece scegliamo H′ allora V non e piu orizzontaleed ha una componente verticale non nulla. Si noti inoltre che invece che per un vettore, comead esempio V ′, la caratteristica di essere verticale, cioe tale che π∗V

′ = 0, non dipende dallascelta di uno spazio orizzontale.

11.3.3 Distribuzioni involutive [KN]. Data una varieta M di dimensione n, si chiamadistribuzione d-dimensionale Σ su M l’assegnazione di un sottospazio d-dimensionale Σx ⊂ TxMad ogni punto x ∈ M . Si dice che Σ e differenziabile se per ogni x esiste un intorno apertoU ⊂M di x e d campi vettoriali differenziabili ξi ∈ X (U), i = 1, . . . , d tali che ξi(y)di=1 sianouna base di Σy per ogni y ∈ U . Dato un campo vettoriale ξ ∈ X , si dice che ξ appartiene a Σse ξ(x) ∈ Σx per ogni x ∈M . Infine si dice che Σ e una distribuzione involutiva se la parentesidi Lie di due campi in Σ e ancora in Σ.Sia dunque M dotato di una distribuzione Σ e sia S una sottovarieta connessa di M e i : S →Mla sua immersione in M . Si dice che S e una varieta integrale per Σ se i∗(TxS) = Σx per ognix ∈ S. Si dice che S e massimale se non ci sono varieta integrali per Σ che la contengono.L’esistenza di una varieta integrale massimale e sempre garantita per distribuzioni differenziabiliinvolutive, si veda 11.5.1.

11.3.4 Connessione su un fibrato differenziale. Sia (E, πEM ,M, F,G) un fibrato differen-ziale su una varieta n−dimensionale M e fibra F . Si chiama connessione una distribuzionedifferenziabile su E che assegni ad ogni punto ξ ∈ E un sottospazio orizzontale n−dimensionaleHξ di TξE, dove per orizzontale si intende trasversale alla fibra (che per convenzione si diceessere verticale) cioe tale per cui

TξE ' TξFπEM (ξ) ⊕ Hξ.

In pratica significa che la proiezione di πEM : E → M induce un isomorfismo tra Hξ e TxM ,dove x = πEM(ξ).

11.3.5 Trasporto parallelo. Una connessione determina allora un trasporto parallelo localenel seguente modo: sia ξ0 ∈ Ep (con p = πEM(ξ0)) il punto della fibra da trasportare lungo

Page 202: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 202

la curva γ : R → M , γ(0) = p. Sia poi ε > 0 sufficientemente piccolo perche la curva

ristretta a Iε := (−ε, ε) non si autointersechi. Allora ∆ = πEM−1

(γ(Iε) definisce un fibratosu δ := γ(Iε), con le stesse fibre di E. In particolare Tξ∆ ⊂ TξE e un sottospazio lineareper il quale la decomposizione stabilita dalla connessione induce una analoga decomposizioneTξ∆ ' TξFπEM (ξ)⊕hξ, dove hξ e un sottospazio unidimensionale ∀ξ ∈ ∆. Dunque hξ individua uncampo di direzioni preferenziali in T∆. Esiste quindi un’unica curva γ : Iε −→ ∆, univocamentedeterminata dalla curva integrale definita dal campo di direzioni e passante per ξ0 (si veda 4.5.4).

Il fatto che il trasporto ottenuto sia solamente locale e dovuto al fatto che si tratta di unproblema di Cauchy di cui e garantita solamente l’esistenza e unicita locale, mentre puo cap-itare che nel prolungamento la curva γ vada all’infinito lungo le fibre23.I casi interessanti sono quelli in cui e garantita l’esistenza globale. La curva γ cosı univocamentedeterminata si chiama sollevamento orizzontale di γ e definisce il trasporto parallelo del vettorein modo ovvio: γ(1) ∈ Tγ(1)M e il trasporto parallelo di γ(0) = ξ0 ∈ Fp in Tγ(1)M lungo ilcammino γ.Se il cammino e chiuso allora γ(1) = γ(0), ma in generale γ(1) 6= γ(0). Il trasporto parallelo lun-go i cammini chiusi definisce un automorfismo della fibra. Se tale automorfismo individua sem-pre un elemento del gruppo di trasformazioni G, si parla di G−connessione. Le G−connessionihanno il vantaggio di poter essere definite passando attraverso il fibrato principale e sono semprebuone nel senso che garantiscono l’esistenza globale dei sollevamenti orizzontali.

11.3.6 Campi verticali e campi fondamentali. Sia E lo spazio totale di un fibratoE

π→ M . Una sezione ψ ∈ X (E) si dice campo verticale se (dπ)(ψ) = 0. Se si tratta di unfibrato principale E = P , allora si ha un’azione libera, e transitiva sulle fibre, R : G×P −→ P .Fissato p ∈ P , introduciamo l’applicazione

fp : G −→ P , g 7−→ R(g, p) .

Il differenziale di fp e una mappa che ad ogni elemento X ∈ Lie(G) associa un vettore verticaleξp(X) ∈ TpP :

(dfp)e : TeG = Lie(G)→ TpP X 7−→ ξp(X).

Il campo ξ(X) ∈ X (P) cosı ottenuto si chiama campo fondamentale associato a X. Il fattoche l’azione di G sia libera e transitiva implica il fatto importante che ad ogni vettore verticaleχ ∈ TpP corrisponde un unico X ∈ Lie(G) tale che ξp(X) = χ. In generale dunque parlandodi campi verticali su un fibrato principale intenderemo i campi fondamentali associati.

11.3.7 Connessione infinitesima. L’idea di come costruire una connessione su un fibratovettoriale π : E −→M e piuttosto semplice. Dato un vettore ψ ∈ TξE, si puo stabilire in modonaturale se sia verticale, ovvero se ‘giace lungo le fibre’: cio avviene se π∗ψ = 0. Tuttavia ingenerale non e possibile scomporre il vettore ψ in componente orizzontale e componente verti-cale, a meno che in ogni punto ξ ∈ E non sia assegnata una scomposizione TξE ' TξF ⊕Hξ.Questo e infatti il ruolo della connessione.

23il problema non si pone nel caso di fibre compatte per cui il teorema di esistenza e unicita e garantitoglobalmente

Page 203: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 203

D’altra parte una tale scomposizione definisce un operatore lineare ωξ : TξE → TξF che altronon e che il proiettore sulla TξF e che di ogni vettore ψ ∈ TξE ci da la sua componente verti-cale. Se Hξ e una distribuzione differenziabile allora ωξ definisce una uno forma su E a valoriin F ' TξF .Viceversa sia ωξ : TξE −→ TξF una mappa lineare suriettiva. Essa definisce allora unascomposizione

TξE ' TξF ⊕ ker(ωξ) .

Se ωξ dipende in modo liscio da ξ allora otteniamo una connessione ponendo Hξ := ker(ωξ). Sidice allora che ω e una connessione infinitesima su E.Data una connessione infinitesima ωE, il sollevamento orizzontale per ξ di una curva γ : R→Me la curva γ : R→ E che risolve l’equazione differenziale ωE(γ(t))[ ˙γ(t)] = 0, con γ(0) = ξ. Valeallora il seguente teorema.

11.3.8 Teorema. Sia π : E −→M un fibrato vettoriale sul quale sia definita una connessioneinfinitesima ωE. Allora ωE definisce il trasporto parallelo delle fibre lungo ogni curva γ :[−ε, ε]→M .

11.3.9 Connessione sui fibrati prodotto. Siano E1 ed E2 due fibrati vettoriali su M ,ciascuno dotato di una connessione ci : TEi −→ HiEi, i = 1, 2 dove Hi,ξEi e il sottospazioorizzontale di TξEi, ξ ∈ Ei. Sia poi E = E1 ⊗M E2 il loro prodotto tensore. Allora leconnessioni ci inducono una connessione c = c1 ⊗ c2 su E. Basta infatti osservare (esercizio)che TE ' TE1 ⊗TM TE2, cosicche basta scegliere HξE := H1,ξ1E1 ⊗TM H2,ξ2E2, cioe lo spazioorizzontale del prodotto tensore e il prodotto fibrato degli spazi orizzontali.

11.3.10 Connessione sul fibrato duale. In modo analogo la connessione c su un fibratovettoriale E individua una connessione c∗ sul fibrato duale E∗: gli spazi orizzontali di TE∗ sonosemplicemente i duali degli spazi orizzontali di TE. E una buona definizione grazie al fatto cheTE∗ ' (TE)∗ (verificare).

11.3.11 G-connessioni sui fibrati principali. Spesso e conveniente considerare le connes-sioni sui fibrati principali. Sia P πM−→ M un fibrato principale con gruppo G. Una connessionesu P assegna in ogni punto ξ ∈ P una decomposizione TξP ' TξPx ⊕ Hξ ed una proiezioneπ : TξP → TξPx, π(Hξ) = 0 dove si e posto x = πM(ξ). Si dice che e una G−connessionese la distribuzione di direzioni orizzontali e invariante a destra, cioe se R∗g(Hξ) = HRgξ. Inparticolare dunque R∗g commuta con la proiezione π.

11.3.12 Connessione infinitesima su un fibrato principale. Analogamente al caso deifibrati vettoriali, si puo costruire anche su P una connessione infinitesima. Si otterra allora unauno forma su P che ad ogni campo χ ∈ X (P) associa la sua proiezione verticale. Dato che icampi verticali si identificano con quelli fondamentali, avremo allora che per ogni p ∈ P

ωp : TpP −→ Lie(G) .

Page 204: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 204

In altre parole se χ e un campo verticale allora ωp(χp) = X, l’unico elemento di Lie(G) individu-ato dal campo fondamentale corrispondente. In piu se la connessione su P e una G-connessioneallora lasciamo come esercizio la verifica del fatto che R∗gω = Ad(g−1)(ω) per ogni g ∈ G, doveRg come al solito indica l’azione a destra di G su P . Chiameremo questa una G-connessioneinfinitesima.

In particolare possiamo dire che essenzialmente la restrizione di ω alle fibre si identificacon la forma di Cartan J su G. Si ricordi infatti che ogni fibra e isomorfa a G e le proprietadi J descritte in 11.2.1. In conclusione si chiama G-connessione infinitesima una 1−formaω ∈ Ω(P)⊗ Lie(G) con le proprieta

1. ω|Px = ψ∗J per ogni x ∈ M , e per ogni isomorfismo ψ : Px −→ G indotto da unabanalizzazione locale. Ovviamente J e la forma di Cartan sul gruppo;

2. R∗gω = Ad(g−1)(ω) per ogni g ∈ G.

Abbiamo dunque visto che una G−connessione definisce una connessione infinitesima. Ma evero anche il contrario, dato che una connessione infinitesima ω grazie alla proprieta 1) individuauna famiglia di direzioni orizzontali Hξ in ogni punto, che risulta essere invariante a destra inconseguenza alla proprieta 2). Non e difficile dimostrare che su ogni fibrato principale e semprepossibile determinare una connessione infinitesima ω e quindi una G−connessione. In sostanzae sufficiente costruirla su ogni banalizzazione locale di P e poi definirla su tutto P tramite unapartizione dell’unita. Data ω, il sollevamento orizzontale per ξ di una curva γ : R → M e lacurva γ : R→ P che risolve l’equazione differenziale ω(γ(t))[ ˙γ(t)] = 0, con γ(0) = ξ.

11.3.13 Teorema. Sia π : P −→ M un fibrato principale su M dotato di una connessioneinfinitesima ω. Allora ω definisce il trasporto parallelo delle fibre lungo ogni curva γ : [a, b]→M .

11.3.14 Connessioni infinitesime e fibrati associati. Vediamo infine il legame tra leconnessioni infinitesime sui fibrati vettoriali e quelle sui fibrati principali. Ricordiamo che illegame tra un fibrato principale e quello vettoriale associato e E = P ×ρ F . Allora avremoTE = TP×ρ∗TF , sicche per un vettore nel punto [p, v] di E (con le parentesi quadre indichiamola classe di equivalenza)

(χp, wv) ∼ ((Rg∗(χ))Rg(p), (ρ(g)∗w)ρ(g)v) , ∀χp ∈ TpP , wv ∈ TvF .

Si noti che qui con ρ∗ non si intende la rappresentazione dell’algebra di Lie del gruppo distruttura, ma piuttosto l’azione di G su TF ottenuta differenziando la mappa

ρg : F −→ F , v 7−→ ρ(g)v .

Si noti inoltre che come sopra χ si identifica con un elemento di Lie(G) (si veda 11.3.6), comesottintenderemo qui di seguito.Sia ora ω una connessione infinitesima su P . Fissiamo un punto ξ ∈ E. In termini del fibratoprincipale potremo scrivere ξ = [p, v]. Un vettore Vξ ∈ TξE sara allora individuato da una

Page 205: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 205

coppia (χp, wv), che come sopra definisce una classe di equivalenza Vξ = [χp, wv]. Infine si usi ρper indicare la rappresentazione di Lie(G) indotta da ρ. Allora ω induce su E la connessioneinfinitesima

ωE|ξ ((χp, wv)) = ρ∗(ωp(χp))wv ∈ TvF ,

cioe e definita dall’azione dell’elemento ωp(χp) ∈ Lie(G) su TF .Per vedere che essa e ben definita occorre verificare che non dipende dalla scelta deirappresentanti delle classi di equivalenza, cioe deve essere ρ∗ equivariante. Infatti se

(χ′, w′) = ((Rg∗(χ))Rg(p), (ρ(g)∗w)ρ(g)v)

e un altro rappresentante in ξ = (Rg(p), ρ(g)v) ωE deve far corrispondere il vettore

ρ(g)∗ ωE|ξ ((χp, wv)) ∈ Tρ(g)vF.

Per capire meglio questo fatto, si osservi che la connessione infinitesima su E deve avere valorein TξF . Nella descrizione di E in termini di P ed F , si ha che i suoi punti sono determinati dallecoppie (p, v), cosicche TξF e descritto da TvF . Tuttavia, per la precisione con TξF si intende laparte verticale di TξE, la quale dipende solamente da ξ e non dal rappresentante. Se cambiamorappresentante per ξ, passando al rappresentante (p′, v′) = (pg, ρ(g)v), allora TξF sara oraidentificato con Tv′F e la relazioni di equivalenza introdotte sopra richiedono l’dentificazioneTv′F = ρ(g)∗TvF , che significa che i vettori w ∈ TvF e ρ(g)∗ ∈ Tv′F vanno identificati in TξF .Lasciamo come esercizio al lettore la dimostrazione del fatto che dunque ωE e ben definita se esolo se ω e una G-connessione.Viceversa, data una connessione su E si puo determinare la connessione sul fibrato principalesottostante, imponendo la stessa relazione di cui sopra tra ωE ed ω. Si ottiene allora unaG-connessione.

11.3.15 Osservazione. La costruzione teste data per la connessione infinitesima su E puosembrare piuttosto involuta. Infatti le notazioni e la definizione stessa di connessione infinitesi-ma su E potrebbero essere alleggerite sfruttando l’isomorfismo naturale tra TξF ed F . Tuttavia,senza tali restrizioni, il formalismo qui utilizzato puo resta valido per estensioni a fibrati piugenerali dei fibrati vettoriali. Si noti infatti che per un fibrato differenziale differenziale (in cuiF e una varieta che ammette un’azione ρ di G) allora TξF e pur sempre uno spazio vettoriale(non piu identificabile con F ) su cui G agisce tramite ρ∗.

11.4 Derivate covarianti (connessioni di Koszul)

Torniamo ora sul problema della definizione di una derivata covariante.

11.4.1 Derivata covariante (connessione di Koszul). Sia π : E → M un fibrato K-vettoriale su una varieta M . Sia Γ(M,E) il C∞(M)-modulo delle sezione globali di E (siricodi che per s ∈ Γ(M,E) e f ∈ C∞(M) la sezione globale fs ∈ Γ(M,E) e definita da(fs)(x) := f(x)s(x) ∈ Ex per x ∈ X). Sia

Ωp(M,E) := Γ(M, (∧pM)⊗ E),

Page 206: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 206

il C∞-modulo delle p-forme differenziali a valori in E, cioe le sezioni globali del fibrato vettoriale(∧pM)⊗ E dove ∧pM e il fibrato delle p-forme su M . In particolare, Ω0(M,E) = Γ(M,E).Una derivata covariante o conessione di Koszul su E e un’applicazione K-lineare

∇ : Γ(M,E) −→ Ω1(M,E) = Γ(M,T ∗M ⊗ E),

con la proprieta (regola di Leibnitz)

∇(fψ) = df ⊗ ψ + f∇ψ,

per ogni f ∈ C∞(M,K) e ψ ∈ Γ(M,E). In pratica, la derivata covariante ad ogni sezione delfibrato vettoriale associa una 1-forma a valori nello stesso fibrato.La valutazione della 1-forma ∇ψ su un campo vettoriale ξ ∈ X (M) definisce la derivatacovariante direzionale associata a ∇.

11.4.2 Motivazione. Sia π : E → M un fibrato vettoriale. Dato un campo di vettori X suM e una sezione liscia s : M → E del fibrato, vogliamo cercare di definire una derivata Xs dis tale che anche Xs sia una sezione del fibrato E. Si noti che per x ∈M il differenziale

(ds)x : TxM −→ Ts(x)E

permette di definere (ds)x(X(x)) ∈ Ts(x)E, mentre noi ora vogliamo ottenere un elemento diEx.Se possibile, questo e collegato alla definizione di un trasporto parallello: dato un x ∈M e unv ∈ Ex := π−1(x), il suo trasporto parallelo sara dato da una sezione s del fibrato in un intornodi x tale che s(x) = v e Xs = 0.

Facciamo subito un primo tentativo: sia U ⊂M un intorno di coordinate tale che il fibrato,indicato ancora con π,

π : EU := π−1U −→ U ,

sia banaleΨ : EU

∼=−→ U × Rn

con Ψ un isomorfismo di fibrati. Allora le sezioni lisce s : U → EU corrisponderanno alle mappelisce e : U → Rn nel modo seguente:

(Ψ s)(x) = (x, e(x)) (∈ U × Rn).

Un campo di vettori X su U si scrive come X =∑

i ai(∂/∂xi) dove le xi sono le coordinate suU e ai ∈ C∞(U). Allora si potrebbe definire una sezione

Xs : U −→ EU , (Xs)(x) := Ψ−1(x, (Xe)(x)),

dove e = (e1, . . . , en) con ei ∈ C∞(U) e X(e) = (X(e1), . . . , X(en)). Un problema di questadefinizione e che X(s) dipende in modo essenziale dall’isomorfismo Ψ. Considerando un iso-morfismo Ψ2 : EU → U × Rn si ha (Ψ2Ψ−1)(x, e(x)) = (x, g(x)e(x)) per un’applicazione liscia

Page 207: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 207

g : U → GLn(R), e la regola di Leibnitz applicata a X(ge) mostra che in generale non vale larelazione X(ge)(x) = g(x)(Xe)(x). Quindi questa definizione di Xs dipende dalla scelta di Ψ.

E meglio dunque definire in modo globale tali ‘derivate di sezioni’ e poi studiare come sipuo calcolarle localmente.

11.4.3 Derivata covariante direzionale. Sia ∇ una connessione di Koszul su E e siaX ∈ X (M) un campo di vettori su M . Allora definiamo un’applicazione, detta derivatacovariante direzionale,

∇X : Γ(M,E) −→ Γ(M,E), ψ 7−→ ∇(ψ)(X),

cioe si usa la contrazione Ω1(M) = Γ(M,∧1M)→ C∞(M) data da ω 7→ ω(X), per passare da∇(ψ) ∈ Γ(M, (∧1M)⊗ E) a ∇(ψ)(X) ∈ Γ(M,E).La derivata direzionale ha le seguenti proprieta:

∇X(fψ) = (f∇(ψ) + (df)⊗ ψ)(X) = f∇Xψ +X(f)ψ,

detta regola di Leibnitz. In piu si ha

∇fX+gY (ψ) = f∇X(ψ) + g∇Y (ψ)

per ψ ∈ Γ(M,E), X, Y ∈ X (M) e f, g ∈ C∞(M) perche se ω e una 1-forma, si ha ω(fX) =fω(X) e quindi ∇fX+gY (ψ) := ∇(ψ)(fX + gY ) = f∇(ψ)(X) + g∇(ψ)(Y ).

11.4.4 Simboli di Christoffel. Sia π : E → M un fibrato vettoriale di rango n, siaU ⊂ M un aperto coordinato, con coordinate x1, . . . , xm : U → R (dove m = dimM), e siaΨ : EU → U × Rn una banalizazzione. Siano e1, . . . , en i vettori di una base standard di Rn esiano ei : U → EU le sezioni corrispondenti, ei(x) := Ψ−1(x, ei). Allora ogni sezione ψ : U → EUsi scrive come ψ(x) =

∑ψi(x)ei(x) per certe funzione ψi ∈ C∞(U).

Sia ∇ una derivata covariante su un fibrato π : E →M , allora si ha:

∇(ψ) = ∇(n∑i=1

ψiei) =n∑i=k

ψk∇(ek) + (dψk)⊗ ek.

Poiche ogni una forma ω su U si scrive come ω =∑ajdxj per certe funzioni aj ∈ C∞(U), ogni

uno forma ωE su U con valori in E si scrivera come

ωE =n∑i=1

ei ⊗ ωi =n∑i=1

m∑j=1

aijei ⊗ dxj (∈ Ω1(U,E))

per certe aij ∈ C∞(U). Quindi per ogni k, k = 1, . . . , n, la uno forma ∇(ek) con valori in E siscrive come:

∇(ek) =n∑i=1

m∑j=1

Γikjei ⊗ dxj =m∑j=1

ωikei,

Page 208: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 208

per certe funzioni Γikj ∈ C∞(U), dette i simboli di Christoffel, e la matrice n×n con coefficientiin Ω1(U)

ω = (ωik)1≤i,k≤n (∈Mn(Ω1(U)), ωik =m∑j=1

Γikjdxj

e detta matrice di uno forme della connessione di Koszul ∇ (su U , rispetto a Ψ). Con questedefinizioni, si ha ∇(ek) = ωek.Ogni campo vettoriale X su U si scrive localmente come X =

∑l al(∂/∂xl) con al ∈ C∞(U),

l = 1, . . . ,m. Poiche dxj(∂/∂xl) = δjl, si ha

∇(∂/∂xl)(ek) := ∇(ek)(∂/∂xl) =

(n∑i=1

m∑j=1

Γikjei ⊗ dxj

)(∂/∂xl) =

n∑i=1

Γiklei.

Per X generale, si ha allora

∇X(ek) = ∇∑ al(∂/∂xl)(ek) =m∑l=1

n∑i=1

alΓiklei.

Non e difficile rendersi conto del fatto che i coefficienti di Christoffel non individuano dei tensori,cioe sezioni del fibrato T ∗M ⊗ T ∗M ⊗ TM . Rimandiamo comunque tale questione a 11.6.17.Vediamo invece un primo legame tra connessione infinitesima e la derivata covariante.

11.4.5 Connessione infinitesima e derivata covariante direzionale. Sia Xp ∈ TpM e

ψ ∈ Γ(M ;E) una sezione di un fibrato EπE→ M su M . Sia poi γ : [0, 1] → M una curva in

M tale che γ(0) = p e γ(0) = Xp. Sia infine cγ il trasporto parallelo lungo γ indotto da unaconnessione infinitesima ω su E. Otteniamo una derivata covariante di ψ lungo il vettore Xp

nel punto p tramite

∇ωXpψ(p) := lim

h→0

1

hc−1γ(h)(ψ(γ(h)))− ψ(p) .

In pratica si confrontano i valori di σ in due punti distinti trasportando il secondo nella stessafibra del primo. E un esercizio dimostrare che infatti ∇ω

Xpψ(p) esiste sempre e non dipende da

γ ma solamente da p e Xp e dalla connessione ω. In particolare se Xp = X(p) e il valore in p diun campo vettoriale X ∈ Γ(M,TM), allora l’assegnazione x 7−→ ∇ω

Xψ(x) definisce una sezioneliscia del fibrato E, che chiameremo ∇ω

Xψ.Si lascia come esercizio la verifica del fatto che ∇ω

X ha le proprieta una derivata covariantedirezionale. Per l’arbitrarieta di X, una connessione ω su un fibrato vettoriale definisce dunqueuna derivata covariante ∇ω. Vedremo piu avanti che in effetti vale anche il discorso inverso.

11.4.6 Derivata covariante, prodotto tensore e duale. Siano E1 ed E2 due fibrativettoriali dotati di derivate covarianti ∇i, i = 1, 2. Si ottiene una derivata covariante sulprodotto tensore dei fibrati ponendo

∇ = ∇1 ⊗ idΓ2 + idΓ1 ⊗∇2 ,

Page 209: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 209

dove Γi := Γ(M,Ei).Analogamente si determina la derivata covariante sul duale E∗ di un fibrato vettoriale E. Seψ ∈ Γ(M,E) e λ ∈ Γ(M,E∗) si impone la relazione d(λ(ψ))[ξ] = (∇∗ξλ)[ψ] + λ(∇ξψ).

11.4.7 Esercizio. Si dimostri che si ottengono le stesse relazioni utilizzando la connessioneprodotto 11.3.9, la connessione duale 11.3.10 e la relazione in 11.4.5.

11.4.8 Derivata covariante e sollevamento orizzontale. Indichiamo con ∇ω la derivatacovariante associata alla connessione infinitesima ω. Sia poi γ il sollevamento orizzontale in Edi una curva γ : [0, 1]→M , costruito a partire da ω.Posto Γ = γ([0, 1]) l’immagine di γ in M , supponiamo per semplicita che Γ individui una sot-tovarieta monodimensionale di M . Per ogni sezione liscia ψ ∈ Γ(Γ, E) e quindi ben definitala derivata covariante ottenuta per restrizione a Γ di ∇ω e la conseguente derivata direzionalelungo i vettori tangenti a Γ. In altre parole e ben definita la derivata ∇ω

γ (ψ γ) =: ∇γ(ψ)(γ(t)).In particolare essa risulta ben definita su γ e dalla definizione data in 11.4.3 si ottiene imme-diatamente ∇γ γ = 0.Questo suggerisce come, viceversa, si possa costruire una connessione ω∇ partendo da unaderivata covariante ∇, definendo i sollevamenti orizzontali mediante le soluzioni dell’equazione∇γ γ = 0. Lasciamo come esercizio i dettagli di una tale costruzione. Vogliamo ora approfondireil legame tra ω e ∇.

11.4.9 Sezioni e funzioni equivarianti. Allo scopo di determinare una relazione piu esplici-ta tra derivata covariante e connessione e conveniente analizzare piu a fondo la corrispondenzatra il fibrato principale P e il fibrato vettoriale associato E di fibra V . Ricordiamo che questultimo e costruito a partire dalle classi di equivalenza [p, v] = [Rgp, ρ(g−1)(v)] dove ρ(g) e l’ele-mento di Aut(V ) individuato dalla rappresentazione ρ del gruppo di struttura G su V . Siaψ ∈ Γ(M,E) una sezione liscia. Allora potremo scrivere ψ(x) = [p(x), v(x)], dove p(x) ∈ Pxe v(x) ∈ V . Ricordando che l’azione di G su ogni fibra Px e libera e transitiva, possiamoallora associare alla sezione ψ una applicazione αψ : P −→ V , tale che ψ(x) = [p, αψ(p)]. Perconsistenza deve accadere che

[Rgp, αψ(Rgp)] = [p, αψ(p)] = [Rgp, ρ(g−1)ψ(p)] ,

e quindi R∗gαψ = ρ(g−1)αψ. Diremo che αψ e G−equivariante e scriveremo αψ ∈Map(P , V )G.

Si verifica allora facilmente che l’applicazione

ΦG : Γ(M,E) −→Map(P , V )G, ψ 7−→ αψ ,

e un isomorfismo di K−spazi vettoriali.

11.4.10 Forme tensoriali. Piu in generale questa corrispondenza si estende dalle sezioniallo spazio delle forme tensoriali Ωk(M,E), le k−forme a valore nel fibrato. Se ξi ∈ TxM ,i = 1, . . . , k, allora sian ξi i rispettivi sollevamenti orizzontali. Allora, per ogni λ ∈ Ωk(M,E)si ottiene una unica forma orizzontale ΦG(λ) ∈ Ωk(P , V ) equivariante tale che

λ(ξ1, . . . , ξk) = [p,ΦG(λ)(ξ1, . . . , ξk)] ,

Page 210: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 210

dove orizzontale significa iχΦG(λ) = 0 per ogni campo verticale χ. Naturalmente ΦG(λ) deveessere G−equivariante (par.11.4.9) affinche la mappa sia ben definita. In particolare e unisomorfismo. Scriveremo ΦG : Ωk(M,E) −→ ΩG

H(P , V ).Questo ci permette di estendere la connessione di Koszul alle forme tensoriali

∇ : Ωk(M,E) −→ Ωk+1(M,E) .

Localmente Ωk(U,E) sara generato da forme del tipo λ = σ⊗ψ dove ψ ∈ Γ(U,E) e σ ∈ Ωk(M),cosicche

∇λ = dσ ⊗ ψ + (−1)kσ ∧∇ψ .

11.4.11 Derivata covariante e connessione infinitesima. Vogliamo ora determinareuna corrispondenza esplicita tra la derivata covariante e la connessione infinitesima sul fibratoprincipale.Utilizziamo la mappa ΦG per calcolare il limite in 11.4.3. Posto che y ∈ P tale che π(y) = p ∈Msia γ il sollevamento orizzontale di γ in P , passante per y. Allora avremo che ψ(p) = [y, αψ(y)]

e ψ(γ(h)) = [γ(h), αψ(γ(h))]. Infine cEγ(h)

−1(ψ(γ(h))) = [y, αψ(γ(h))], sicche

∇ξψ(p) = limh→0

1

hcEγ(h)

−1(ψ(γ(h)))− ψ(p)

= limh→0

1

h[y, αψ(γ(h))]− [y, αψ(y)]

= [y, dαψ(p)[ξH]] ,

dove ξH e il sollevamento orizzontale di ξH in P . Dunque possiamo scrivere ΦG∇ξψ = ξH · αψ.Ora osserviamo che la rappresentazione ρ di G su V induce una rappresentazione ρ∗ di Lie(G) suV , ottenuta differenziando ρ nell’identita di G. La relazione di G−equivarianza per αψ assumeallora la forma ξa · αψ + ρ∗(a) αψ = 0, dove ξa e il campo verticale generato dall’elementoa ∈ Lie(G). Utilizzando questa relazione otteniamo dαψ(ξH) = (d + ρ∗(ω))αψ(ξ) e quindi

ΦG∇ξψ = (d + ρ∗(ω))αψ(ξ) .

Questa formula rappresenta la relazione cercata ed ha una semplice interpretazione: αψ e inpratica la componente lungo la fibra del campo vettoriale. Per garantire la covarianza delladerivata occorre correggere il differenziale tramite la trasformazione infinitesima associata allospostamento infinitesimo degli spazi vettoriali da confrontare. Tale trasformazione e descrittadall’elemento ω dell’algebra, che agisce sulla fibra tramite la rappresentazione ρ.Viceversa tale formula permette di definire e calcolare in modo pratico la derivata covariantesu un fibrato vettoriale. Infatti si noti che

d + ρ∗(ω) : Ω0H(P , V ) −→ Ω1

H(P , V ) .

Un ragionamento analogo, piu semplice, puo essere fatto per trovare il legame tra laconnessione infinitesima ωE su E e la derivata covariante. Lo lasciamo come esercizio.

Page 211: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 211

11.5 Curvature

Una volta definita una connessione su un fibrato, e naturale introdurre il concetto di curvatura.Infatti la connessione individua in ogni punto ξ dello spazio totale E una separazione TξE 'TξF ⊕Hξ. La scelta di Hξ definisce una distribuzione differenziabile (si veda 11.3.3). Ci si puochiedere allora se tale distribuzione sia integrabile, cioe se essenzialmente sia possibile costruireil sollevamento orizzontale dell’intera varieta M in E. In altre parole cio accade se per ogniξ ∈ E esiste un’immersione regolare di i : M → E, tale che i∗TM ∈ H, vale a dire che inogni punto i vettori tangenti all’immagine dell’immersione sono orizzontali e che ξ appartengaall’immagine di i. Questo implica che le parentesi di Lie tra due campi orizzontali debbanodare sempre un campo orizzontale (verificare). Nel linguaggio di 11.3.3 cio significa che He una distribuzione involutiva e che MH(ξ) := i(M) e una varieta integrale per H, passanteper ξ. Ricordiamo che essa si dice massimale se non esistono superfici integrali per H che lacontengano propriamente. Enunciamo senza dimostrarlo il seguente importante risultato.

11.5.1 Teorema di Frobenius. Sia H una distribuzione differenziabile involutiva su E.Allora, per ogni ξ ∈ E esiste una unica varieta integrale massimale MH(ξ) di H.

A commento di questo teorema osserviamo il suo significato intuitivo: se ξ e un vettoreorizzontale in i(x), allora la sua curva integrale in E deve giacere nell’immagine di i e tuttii suoi vettori tangenti devono essere orizzontali. Questo deve essere vero per ogni vettoreorizzontale di un intorno di x. Dunque la proprieta appena vista deve essere vera per il flussolocale. Dato che il flusso locale determina la derivata di Lie e a sua volta le parentesi di Lie,si vede che la involutivita e una condizione necessaria. Non e molto difficile vedere che e anchelocalmente sufficiente.

11.5.2 Forma di curvatura. L’involutivita di H e dunque una condizione necessaria esufficiente per la sua integrabilita. Siano X e Y due campi orizzontali secondo la connessioneinfinitesima ω su E. Chiaramente [X, Y ] e orizzontale se e solo se ω([X, Y ]) = 0. Percio laquantita ω([X, Y ]) determina l’ostruzione all’integrabilita di H.Ovviamente la decomposizione TpE ' TpF ⊕Hp definisce un proiettore

πH : TpE −→ Hp ,

per ogni p ∈ E che indicheremo con XHp = πH(Xp) per ogni Xp ∈ TpE.Data una p−forma λ ∈ Ωp(E), si chiama parte orizzontale di λ la p−forma Hλ definita daHλ(Ψ1, . . . ,Ψp) := λ(ΨH1 , . . . ,Ψ

Hp ) per ogni p−upla di campi vettoriali su E, Ψi ∈ X (E).

Si chiama forma di curvatura la due forma ΩE := H(dω) ∈ Ω2(M,E). Cioe per ogni coppiaX, Y ∈ X (E) si ha

ΩE(X, Y ) = dω(XH, Y H) ,

dove, come sopra, XH e Y H sono le parti orizzontali dei campi X e Y . Utilizzando la formuladi Cartan si trova

ΩE(X, Y ) = XH(ω(Y H))− Y H(ω(XH))− ω([XH, Y H]) = ω([χH, ξH]) ,

Page 212: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 212

cioe la curvatura misura proprio l’ostruzione all’integrabilita di H. Esattamente come inprecedenza in generale e sufficiente considerare la curvatura sul fibrato principale.

11.5.3 Proposizione. Equazione di struttura. Sia π : P −→M un fibrato principale congruppo di struttura G, dotato di una G-connessione infinitesima ω. La connessione infinitesimaω sul fibrato principale P e la relativa curvatura Ω soddifano l’equazione

Ω = dω +1

2[ω, ω] .

Dimostrazione. Sia X un campo verticale associato all’elemento A dell’algebra Lie(G).Allora ω(X) = A. Inoltre, se g = exp(tA), la G−equivarianza di ω puo essere scritta nellaforma infinitesima LXω + [A, ω] = 0. Usiamo questa relazione per dimostrare dapprima che,come Ω, anche Ω := dω + 1

2[ω, ω] e orizzontale. Infatti

iX(dω +1

2[ω, ω]) = LX − d iX(ω) + [A, ω] = 0 ,

per la suddetta relazione e poiche diX(ω) = dA = 0.Basta allora valutare Ω su una coppia di vettori orizzontali Yp e Zp, per vedere che coincide conΩ. 2

Un corollario immediato e il seguente risultato, di cui si lascia la dimostrazione come esercizio.

11.5.4 Proposizione. Identita di Bianchi. La forma di curvatura Ω sul fibrato principaleP dotato di una G-connessione ω soddisfa le seguenti identita:

dΩ = −[ω,Ω] , ovvero HdΩ = 0 .

11.5.5 Tensore di curvatura. Sia E il fibrato vettoriale associato a P tramite la rappre-sentazione (ρ, F ). Supponiamo di dotare P di una G-connessione infinitesima ω. Sia poi Ω laforma di curvatura associata alla connessione ω su P . Dunque Ω e una due forma orizzontalesu P a valori in Lie(G), che soddisfa R∗gΩ = Adg−1Ω. Siano X, Y ∈ TpP e ξ = [p, v] ∈ Eπ(p) unvettore della fibra in x. Allora e ben definita l’applicazione lineare

TX,Y : Ex −→ Ex , [p, v] 7→ [p, ρ(Ω(X, Y ))(v)] ,

endomorfismo della fibra Ex,dove ρ e la rappresentazione di Lie(G) su V indotta da ρ. Si notiin particolare che, dati X, Y ∈ X (P) la mappa

AX,Y (v) : P −→ V ; p 7−→ ρ(Ω(X, Y ))(v) ,

e equivariante. Cio permette, tramite l’isomorfismo ΦG, di definire sulla base M del fibratouna due forma Ω∇ a valori in End(E) che, ad ogni sezione ψ ∈ Γ(M,E) e per ogni coppia dicampi ξ, χ ∈ X (M), associ la sezione

Ω∇(ξ, χ)ψ(x) = [p, ρ(Ω(ξ, χ))(αψ(p))] ,

Page 213: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 213

dove ξ e χ sono i sollevamenti orizzontali di ξ e χ in P nel punto p su x. EvidentementeΩ∇(ξ, χ)ψ ∈ Γ(M,E). La forma Ω∇ si chiama tensore di curvatura e definisce una sezione di(T ∗M ∧ T ∗M)⊗ (E∗ ⊗ E).

11.5.6 Proposizione. Il tensore di curvatura Ω∇ e legato all’operatore di derivazionecovariante dalla relazione

Ω∇(ξ, χ)ψ = [∇ξ,∇χ]ψ −∇[ξ,χ]ψ ,

in cui le parentesi tra le derivate covarianti sono il commutatore, mentre quelle tra i campi sonole parentesi di Lie

Dimostrazione. Anzitutto abbiamo24

ΦG([∇ξ,∇χ]ψ −∇[ξ,χ]ψ) = ξχαψ − χξαψ − [ξ, χ]αψ = [ξ, χ]αψ − [ξ, χ]αψ ,

dove abbiamo usato il fatto che i campi verticali sono un ideale nell’algebra dei campi. PostoZ := [ξ, χ] ∈ X (E) abbiamo percio che

ΦG([∇ξ,∇χ]ψ −∇[ξ,χ]ψ) = ZV αψ = iZV dαψ = LZV α

ψ ,

dove ZV e la parte verticale di Z. Ma la G−invarianza di αψ, se A ∈ Lie(G) e il generatore diZV , in forma infinitesima si scrive LZV (αψ) = −ρ(A)αψ. Poiche infine A = ω(ZV ), otteniamo

ΦG([∇ξ,∇χ]ψ −∇[ξ,χ]ψ) = ρ(ω([ξ, χ]))αψ = ΦG(Ω∇(ξ, χ)ψ) ,

che implica la tesi, essendo ΦG un isomorfismo. 2

11.5.7 Proposizione. Il tensore di curvatura e legato alla derivata covariante dalla relazioneΩ∇ = ∇2.

Dimostrazione. Basta mostrare che per ogni coppia di campi ξ, χ ∈ X (M) e sezione ψ ∈Γ(M,E) si ha iξiχ∇2ψ = [∇χ,∇ξ]ψ −∇[χ,ξ]ψ. Poiche ∇ψ ∈ Ω1(M,E), localmente esisterannodelle 1−forme λk e delle sezioni φj di E tali che ∇ψ = λjφ

j. Allora

∇∇ψ = dλjφj − λj ∧∇φj .

Basta allora applicarlo a (χ, ξ) utilizzando la formula di Cartan per dλj(χ, ξ) e confrontare conil calolo diretto di [∇χ,∇ξ]ψ −∇[χ,ξ]ψ. I dettagli sono lasciati come esercizio. 2

11.6 Strutture Riemanniane

11.6.1 Esempio: fibrato tangente. Un esempio particolarmente interessante e quello delfibrato tangente. In tal caso il fibrato principale e il fibrato dei riferimenti R e il gruppodi struttura e GL(n,R), essendo n la dimensione della base M . Un riferimento in x ∈ M

24ovunque adoperando il tilde per indicare il sollevamento orizzontale

Page 214: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 214

e individuato da n vettori v1, . . . , vn linearmente indipendenti in TxM . Su di essa M ij ∈

GL(n,R) agisce come vj 7→ viM ij. Se xµ sono delle coordinate locali suM allora vj = vµj

∂∂xµ

e xµ, vνj sono coordinate locali per R (che e infatti una varieta (n2 + n)−dimensionale).Assumiamo infine che su R sia data una connessione ω. Infine, data l’ovvia azione di GL(n,R)e della sua algebra di Lie su Rn, indicheremo semplicemente con gX e AX tali azioni, doveg ∈ GL(n,R), A ∈ gl(n,R) e X ∈ Rn.

11.6.2 Campo orizzontale canonico e forma orizzontale canonica. Un riferimentopuo essere visto come una mappa lineare bijettiva v : Rn −→ TxM , che associa il vettore viall’elemento ei della base canonica di Rn. Se R π−→M e il fibrato dei riferimenti, dotato di unaconnessione infinitesima ω, per ogni X ∈ Rn si definisce il campo orizzontale canonico C(X),tale che se p ∈ R allora C(X)p ∈ TpR e l’unico vettore orizzontale che soddisfa π∗C(X)p = v(X).Si chiama forma orizzontale canonica il suo duale θ = v−1 π∗. Si ha evidentementeθ(C(X)) = X.Si noti che il campo orizzontale canonico non e in realta canonico su un fibrato dei riferimenti,ma piuttosto sul fibrato dei riferimenti con una connessione. La forma canonica invece e ve-ramente canonica, nel senso che non richiede una specificazione di una connessione per esseredefinita. Sia infatti R π−→M un fibrato dei riferimenti e sia ξ ∈ TpR, p ∈ R. Allora p individ-ua un riferimento in TxM , x = π(p), che definisce un isomorfismo v : Rn −→ TxM . Pertantosi puo definire θ(ξ) = v−1π∗ξ. Si tratta evidentemente di una forma orizzontale, dato che siannulla sui vettori verticali.

11.6.3 Forma di torsione. Si chiama forma di torsione la 2−forma su R a valori in Rn

definita daT := Hdθ ,

dove ricordiamo che Hdθ indica la parte orizzontale di dθ, cioe, se X, Y ∈ TR allora

Hdθ(X, Y ) = dθ(XH, Y H) .

Come si verifica facilmente si tratta di una forma orizzontale equivariante e quindi vi corrispondeun tensore di curvatura T tale che ΦG(T ) = T che risulta essere una sezione di (T ∗M ∧T ∗M)⊗TM . In maniera del tutto analoga a 11.5.7 si dimostra la seguente proposizione.

11.6.4 Proposizione. Il tensore di torsione soddisfa la relazione

T (χ, ξ) = ∇χξ −∇ξχ− [χ, ξ] , (∈ X (M))

per ogni coppia di campi χ, ξ ∈ X (M).

11.6.5 Proposizione. I equazione di struttura. La forma di torsione soddisfa l’equazioneT = (d + ω)θ, dove ω e la connessione su R.

Dimostrazione. Prima di tutto vediamo che, come T , (d +ω)θ e orizzontale. Infatti, se ξ(A)e il campo fondamentale associato ad A ∈ gl(n,R), si ha

iξ(A)(d + ω)θ = Lξ(A)θ − d(iξ(A)θ) + (iξ(A)ω)θ − ωiξ(A)θ = Lξ(A)θ + Aθ = 0 ,

Page 215: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 215

dove abbiamo usato il fatto che θ e orizzontale e, nell’ultimo passaggio, l’equivarianza di θ.Dopodiche per verificare l’uguaglianza basta applicare entrambi i membri ad una coppia divettori orizzontali. 2

Nota. L’equazione di struttura che coinvolge la curvatura viene anche detta II equazione distruttura. Differenziando la prima equazione di struttura si ottiene inoltre la seguente identita.

11.6.6 I identita di Bianchi. Vale

dT + ω ∧ T = Ω ∧ θ .

L’identita di Bianchi che coinvolge dΩ in 11.5.4 si chiama anche II identita di Bianchi.

11.6.7 Connessione metrica e di Levi-Civita. Si dice che su M e definita una strutturaRiemanniana se e assegnata una sezione g ∈ Γ(M,T ∗M ⊗T ∗M) simmetrica e definita positiva.In particolare per ogni x ∈M , g(x) ∈ T ∗xM ⊗ T ∗xM e un prodotto scalare su TxM . Scelta unabase per TxM , g(x) sara individuato da una matrice simmetrica con autovalori tutti positivi.Si dice che la struttura e pseudo-Riemanniana se g e simmetrica e non degenere. Si chiamasegnatura s la differenza tra il numero di autovalori positivi e il numero di autovalori negativi.Si dice che la struttura e Lorentziana se |s| = n − 2, essendo n la dimensione di M . Mentree sempre possibile assegnare una struttura Riemanniana ad una varieta liscia, cio non e veroin generale per le strutture pseudo-Riemanniane. In senso improprio g viene chiamata metricaanche nel caso pseudo-Riemanniano.Sia ω una connessione sul fibrato principale R. Si dice che ω e una connessione metrica se g eparallela, cioe se

∇ωg = 0 .

Dato che per ogni X, Y, Z ∈ X (M) si ha (si veda 11.4.6)

iZd(g(X, Y )) = (∇Zg)(X, Y ) + g(∇ZX, Y ) + g(X,∇ZY ) ,

la condizione di metricita equivale a

Z · g(X, Y ) = g(∇ZX, Y ) + g(X,∇ZY ) , ∀X, Y, Z ∈ X (M) .

La metricita della connessione non determina univocamente la connessione stessa. E perofatto ben noto che la connessione e univocamente determinata se oltre alla metricita si richiedel’annullamento della torsione. In tal caso la connessione e detta di Levi − Civita. Vale ilseguente importante teorema.

11.6.8 Teorema. Sia (M, g) una varieta pseudo-Riemanniana. Allora esiste una unicaderivata covariante ∇L−C tale che ∇L−Cg = 0 e T=0.

Dimostrazione. Dati i campi X, Y, Z ∈ X (M), usiamo ripetutamente le relazioni

Z · g(X, Y ) = g(∇ZX, Y ) + g(X,∇ZY ) , metricita della connessione

∇ZX −∇XZ = [Z,X] , torsione nulla

Page 216: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 216

con le varie permutazioni degli indici:

Zg(X, Y ) = g(∇ZX, Y ) + g(X,∇ZY )

= g(∇XZ, Y ) + g(X,∇YZ) + g([Z,X], Y ) + g(X, [Z, Y ])

= Xg(Z, Y )− g(Z,∇XY ) + Y g(X,Z)− g(∇YX,Z) + g([Z,X], Y ) + g(X, [Z, Y ])

= −2g(Z,∇XY ) +Xg(Z, Y ) + Y g(X,Z)− g([Y,X], Z) + g([Z,X], Y ) + g(X, [Z, Y ]) ,

da cui

2g(Z,∇XY ) = Xg(Z, Y ) +Y g(X,Z)− g([Y,X], Z) + g([Z,X], Y ) + g(X, [Z, Y ])−Z · g(X, Y ) .

Poiche questa uguaglianza vale per ogni scelta dei campi e dato che g e nondegenere, ∇XY equindi ∇ sono univocamente determinate da questa espressione. 2

Lasciamo invece come esercizio la verifica del fatto che una connessione e metrica se esoltanto se e una connessione sul fibrato O dei riferimenti ortonormali.

11.6.9 Tensore di Riemann, di Ricci e curvatura scalare. Abbiamo definito il tensoredi curvatura Ω∇ come una due forma a valori in End(E). Nel nostro caso E = TM . Si chiamacampo tensoriale di Riemann R, o semplicemente Tensore di Riemann, il campo tensorialecovariante di grado 4 definito da

R(X, Y,W,Z) := g(Ω∇(W,Z)Y,X) , ∀X, Y,W,Z ∈ X (M) .

Sia eini=1 una base ortonormale per TU , U essendo un aperto di una carta locale per M(dunque con M banalizzabile). Si definisce allora il tensore di Ricci S come il tensore covariantedi grado due

S(X, Y ) := R(ei, X, ej, Y )ηij , ∀X, Y ∈ X (M) .

Qui η e l’usuale metrica (pseudo)euclidea. E facile verificare che S non dipende dalla sceltadella base ortonormale.Infine si definisce lo scalare di curvatura Ric tramite

Ric := S(ei, ej)ηij .

Di nuovo si verifica l’indipendenza dalla scelta della base.Si chiama tensore di Einstein G la particolare combinazione

G := S− Ric

2g .

11.6.10 Nota. Soprattutto in fisica e d’uso indicare le componenti del tensore di Riemannrispetto ad un sistema di coordinate con Rµνσρ, quelle del tensore di Ricci con Rµν e lo scalaredi curvatura con R.

11.6.11 Simmetrie dei tensori di curvatura e curvatura sezionale. Il tensore diRiemann gode delle tre seguenti proprieta di simmetria, di cui lasciamo al lettore i dettaglidella deduzione

Page 217: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 217

• R(X, Y,W,Z) = −R(X, Y, Z,W ), che segue dal fatto che ovviamente Ω∇(W,Z) =−Ω∇(Z,W );

• R(X, Y,W,Z) = −R(Y,X,W,Z). Questa e invece conseguenza del fatto che la connes-sione e metrica. Uno dei modi per verificarlo e infatti osservando che se la connessione emetrica, essa e definita su O e quindi la curvatura Ωω ha valori in nell’algebra di Lie delgruppo ortogonale, che si identifica con le matrici Mi

j che soddisfano Mij = −Mji, doveMij := Mi

kηkj. Dopodiche basta sfruttare i legami tra Ωω ed Ω∇ e tra Ω∇ ed R;

• R(X, Y,W,Z)+R(X,W,Z, Y )+R(X,Z, Y,W ) = 0. Questa e conseguenza della torsionenulla. Essa segue dalla I identita di Bianchi, con T = 0, in modo analogo al puntoprecedente.

Si dimostra facilmente che da queste tre proprieta ne segue una quarta:

R(X, Y,W,Z) = R(W,Z,X, Y ) .

Sia ora Πx un piano bidimensionale in TxM . Sia poi e1, e2 ∈ TxP una base ortonormale perΠx. Si chiama curvatura sezionale relativa al piano Πx il numero reale

κ(Πx) = R(e1, e2, e1, e2) .

E un semplice esercizio verificare che κ(Πx) non dipende dalla scelta della base ortonor-male. L’importanza della curvatura sezionale e dovuta alle due seguenti proposizioni, la cuidimostrazione e lasciata come esercizio.

11.6.12 Proposizione. Sia T un tensore covariante di grado 4 che gode delle stesse proprietadi simmetria del tensore di Riemann. Se

T(X, Y,X, Y ) = R(X, Y,X, Y ) ∀X, Y ∈ TxM, x ∈M ,

allora T = R.

11.6.13 Proposizione. Se X e Y sono due vettori che formano una base per Πx, allora

κ(Πx) =R(X, Y,X, Y )

g(X,X)g(Y, Y )− g(X, Y )2.

11.6.14 Osservazioni pratiche. Per rendere operativa la teoria sviluppata, almeno nel casodel fibrato tangente (il caso generale sara considerato nel prossimo capitolo) consideriamo le coseda un punto di vista fisico. Per misurare ad esempio i vettori velocita in ogni punto della varietae necessario introdurre in ciascun punto un sistema di riferimento, in modo che il passaggio daun sistema all’altro sia differenziabile. Dal punto di vista matematico cio significa considerareuna sezione locale εα : Uα −→ R. In generale una tale sezione non esistera globalmente, a menoche TM sia banalizzabile. Definiamo allora la 1−forma locale eα ∈ Ω1(Uα) tramite eα := ε∗α(θ),

Page 218: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 218

essendo θ la forma orizzontale canonica definita in 11.6.2. Allora, se ξ ∈ X (Uα) e x ∈ Uα,poiche π εα = idM si ha

eα(ξ)x = ε∗α(θ)(ξ) = v−1 dπ(εα∗(ξx)) = v−1(ξ) ,

dove vx : Rn −→ TxM e la mappa indotta dal riferimento vx = vepsα(x) (e che chiamiamo conlo stesso nome). In pratica dunque, scelte delle coordinate locali xµ su Uα, potremo scrivereeiα = eiµ(x)dxµ e ξ = ξµ(x) ∂

∂xµ, cosicche eα(ξ)i = eiµ(x)ξµ. In altre parole ∂

∂xµ= eiµvi, cioe eiµ

sono le componenti di ∂∂xµ

rispetto al riferimento vi.In particolare se su M e definito un campo tensoriale metrico g ∈ Γ(M,T ∗M ⊗S T ∗M), allora

gµν := g

(∂

∂xµ,∂

∂xν

)= eiµe

jνg(vi, vj) .

Si dice che il riferimento locale e ortonormale se g(vi, vj) = ηij, la metrica di Minkowski su Rn.La 1−forma locale eα viene allora detta vielbein.Considerando la I equazione di struttura si ha

deα = dε∗α(θ) = ε∗α(dθ) = ε∗α(−ω ∧ θ + T ) .

Posto ωα := ε∗α(ω), l’espressione locale della connessione infinitesima, abbiamo percio deα+ωα∧eα = ε∗α(T ). Lasciamo come esercizio la dimostrazione della seguente semplice proposizione.

11.6.15 Proposizione. Si ha ε∗α(T ) = v−1(T ), dove T e il tensore di torsione.In altre parole possiamo scrivere25 dei + ωij ∧ ej = T i, dove T i = eiµT

µ.

11.6.16 Osservazioni. Questa formula, valida localmente, risulta essere estremamente praticanelle applicazioni concrete. Si consideri ad esempio di aver a che fare con una varieta pseudo-euclidea M, g e si supponga di voler determinare la connessione di Levi-Civita. Allora dovraanzitutto essere T = 0. D’altra parte la condizione di metricita ∇ωg = 0 (par. 11.6.7) assumela forma ηikω

kj + ηkjω

ki = 0 in termini di un determinato vielbein ei (verificare!). Cio significa

semplicemente che ω ha valori nell’algebra delle isometrie della metrica piatta η. Posto ωij :=ηikω

kj, possiamo allora scrivere le equazioni per la connessione nella forma

dei + ωij ∧ ej = 0 , ωij = −ωji .

Poiche si tratta di n(n − 1)/2 equazioni lineari indipendenti per altrettante incognite (le ωij),la connessione risulta essere completamente determinata in funzione del vielbein.Si puo determinare una formula altrettanto pratica per il calcolo del tensore di curvatura.Infatti, similmente a prima, dalla II equazione di struttura e tenendo conto del fatto che nelcaso del fibrato dei riferimenti si ha evidentemente 1

2[ω, ω] = ω ∧ ω, si ricava immediatamente

dωα + ωα ∧ ωα = ε∗α(Ω) .

25omettiamo il pedice α relativo alla carta locale per evitare confusione con il pedice µ referentesi allacomponente µ−esima nelle coordinate locali

Page 219: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 219

Similmente a prima si ottiene allora che in componenti, rispetto ad una scelta delle co-ordinate locali, si ha (si veda 11.6.21) ε∗α(Ω)ij = eiµe

νj

12Rµ

νρσdxρ ∧ dxσ, dove eµi sono lecomponenti di vi rispetto alla base coordinata (ovvero e l’inversa della matrice di coefficientieiµ). Queste formule forniscono un metodo relativamente rapido per il calcolo del tensore dicurvatura. Ribadiamo pero il fatto che la loro origine e nelle equazioni di struttura che sonoequazioni sul fibrato principale, mentre i tensori di curvatura e di torsione sono sulla varieta M .

11.6.17 Cambio di carta. Vogliamo confrontare le espressioni locali di una data connessioneinfinitesima rispetto a due riferimenti locali sulla stessa carta. Siano ε = vi e ε = vj duesezioni locali rispetto alle quali la connessione infinitesima ω ammette le espressioni localiω = ε∗ω e ˜ω = ε∗ω. Sia ξ ∈ X . Usando il linguaggio in 11.4.9, potremo scrivere, sulla datacarta locale,

ξ(x) = [vi(x), ξi(x)] = [vi(x), ξi(x)] ,

e similmente

∇ξ(x) = [vi(x), dξi(x) + ω(x)ijξj(x)] = [vi(x), dξi(x) + ˜ω(x)ij ξ

j(x)] ,

essendo x appartenente all’intorno locale U considerato. D’altra parte deve esistere una funzionecontinua h : U −→ G tale che ε = Rgε, dove G = GL(n,R) (oppure un gruppo ortogonalese ci si restringe a riferimenti ortonormali) in modo che vi(x) = vj(x)hj i(x) per ogni x ∈ U .Dall’equivarianza di d + ω e dalle relazioni appena scritte segue allora

˜ω(x) = h−1(x)ω(x)h(x) + h−1(x)dh(x) .

Questa relazione e il caso particolare di una proprieta molto generale che verra considerata nelcapitolo successivo.

11.6.18 Ancora sui simboli di Christoffel. Ulteriori espressioni pratiche le otteniamo inbase alle seguenti osservazioni. Se anziche scegliere una base ortonormale si decide di utiliz-zare la base coordinata, allora la forma locale eα avra componenti26 eνµ = δνµ. In tal caso lecomponenti del’espressione locale di ω vengono tradizionalmente indicate con la lettera Γ:

ωµν = Γµσνdxσ

e la I equazione di struttura assume la forma Γµσνdxσ ∧ dxν = T µ = 1

2T µσνdx

σ ∧ dxν ovvero

T µσν = Γµσν − Γµνσ.

In particolare nel caso di torsione nulla i coefficienti Γµσν sono simmetrici nei due indici σ e ν.La matrice di componenti eiµ rappresenta la matrice h di trasformazione tra la base vi e la base

coordinata: ∂∂xµ

= vieiµ, percio si trova

Γµνρdxν = eµj dejρ + eµj ω

ji eiρ ,

26conviene in tal caso usare la lettera greca anche per l’indice relativo alla base vν = ∂∂xν

Page 220: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 220

Si noti che in particolare si ha ∇ ∂∂xµ

= Γνµ∂∂xν

, dove Γνµ := Γνσµdxσ. Se allora ξ ∈ X (M) in

coordinate locali avremo ξ = ξµ ∂∂xµ

e quindi

∇ξ = (dξµ + ξαΓµα)∂

∂xµ.

La condizione di metricita permette allora di determinare i coefficienti Γ in funzione dellametrica e del tensore di torsione. Nel caso di torsione nulla e connessione metrica, si ottiene laben nota espressione

gνµΓµσρ =1

2

∂gνρ∂xσ

+∂gνσ∂xρ

− ∂gσρ∂xν

.

Osserviamo inoltre che per una base coordinata si ha [∂xµ, ∂xν ] = 0 e quindi posto (si veda11.6.9)

Ω∇(∂µ, ∂ν)(∂σ) = Rρσµν∂ρ ,

usando 11.5.6 e le proprieta di ∇, si ottiene

Rρσµν∂ρ = ∇∂µ(Γτσν∂τ )−∇∂ν (Γ

τσµ∂τ ) = ∂µΓρσν∂ρ + Γτσν∇∂µ(∂τ )− ∂νΓρσµ∂ρ − Γτσµ∇∂ν (∂τ ) ,

da cuiRρ

σµν = ∂µΓρσν − ∂νΓρσµ + ΓτσνΓρτµ − ΓτσµΓρτν .

11.6.19 Nota. Nell’intorno di un punto O si possono scegliere delle coordinate locali, dettecoordinate normali, per le quali gµν(O) = ηµν , la metrica di Minkowski o euclidea, e Γµνρ(O) = 0.Si puo verificare allora che (si veda 12.4.4)

gµν(x) = ηµν +1

3Rαµβν(O)xαxβ +O(|xσ|3) .

Questo risultato mostra come la curvatura individui la deformazione rispetto alla geometriaeuclidea.

11.6.20 Esercizio. Si usi la suddetta espressione approssimata, in coordinate normali, per lametrica in un intorno U nel quale le correzioni di ordine superiore al secondo siano trascurabili,per calcolare i simboli di Christoffel nel dato intorno. Si calcoli il trasporo infinitesimo di unvettore tangente in O lungo un cammino rettangolare chiuso tutto contenuto in O. Si dimostriche, se il parallelogramma e generato dai vettori yµ e zν e se vµ e il vettore da trasportare,allora si ottiene per il vettore trasportato

vµ =1

2ΣαβRµ

γαβvγ ,

dove si e posto Σαβ = yαzβ − zαyβ.

Poiche nel punto dato la metrica e (pseudo-)euclidea le componenti del tensore di Riemannpossono essere identificate con quelle della forma di curvatura Ω (in pratica le componenti del

Page 221: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 221

vielbein sono eiµ = δiµ) e quindi questo esercizio mette in evidenza un’interessante proprietageometrica del tensore di curvatura, che permette di interpretare l’azione di Ω visto comeoperatore lineare sullo spazio tangente. Esso individua la ‘rotazione’ subita dal vettore quandoviene trasportato lungo il cammino chiuso.

11.6.21 Esercizio. Si dimostri che, posto (nelle notazioni di 11.6.16)

1

2Ωi

jklek ∧ el = dωij + ωik ∧ ωkj ,

si ottieneRρ

σµν = eρi ejµΩi

jklekµelν ,

dove si ricordi che eρi indica la matrice inversa della eiρ.

11.6.22 Un esempio fisico. Il sistema di riferimento ruotante. Sebbene rimandiamoal capitolo successivo le applicazioni (e le motivazioni) fisiche, vediamo qui un esempio parti-colarmente interessante che mette in evidenza alcuni degli aspetti finora considerati. Vogliamocioe considerare, nell’ambito della relativita, il confronto tra due osservatori O e Oω, il primoinerziale ed il secondo che ruota uniformemente con velocita angolare ω rispetto al primo. Nasceanzitutto il problema di definire esattamente cio che si intende.Per quanto riguarda l’osservatore inerziale O, sappiamo che egli e in grado di costruire glob-almente un sistema di riferimento inerziale, disponendo ovunque di orologi che sincronizzeralanciando e ricevendo raggi luminosi, secondo la ben nota procedura che non andremo quidunque a ripetere. Chiamiamo percio K il sistema di riferimento inerziale di cui O rappresental’origine.La situazione diventa un po piu complicata per l’osservatore Oω. Supponiamo che possiedadegli orologi del tutto identici a quelli di O. Li disporra ovunque in modo che gli appaianosempre immobili. Esattamente come fa O, anche Oω vuol utilizzare il proprio orologio perindividuare la coordinata temporale degli eventi contemporanei. Deve dunque sincronizzare gliorologi. Anzitutto, il suo orologio puo essere sincronizzato a quello di O, poiche sono in ogniistante spazialmente coincidenti. Per sincronizzare gli orologi restanti egli puo usare lo stessometodo di O, mandando raggi luminosi che gli vengono poi riflessi da ciascun orologio. Bencheil raggio luminoso non percorrera (secondo Oω) un cammino rettilineo da Oω all’orologio P ,ne si muovera alla velocita c, un semplice argomento di simmetria (che lasciamo svolgere comeesercizio) mostra che i tempi di andata e di ritorno del raggio luminoso devono coincidere. Eglidirebbe allora che l’orologio P e sincronizzato con il proprio se nel momento in cui riceve ilsegnale, P indica l’ora tp = (t1 − t0)/2 se t0 e l’ora segnata da Oω nel momento in cui lancia ilsegnale e t1 e l’istante in cui Oω riceve il segnale di risposta.Tuttavia tale procedura non e ancora sufficente. La sua costruzione richiede infatti che l’orolo-gio di P cammini alla stessa frequenza del suo. Ma pur essendo identici per costruzione, unavolta posto nella sua posizione P indichera il suo tempo proprio. Dal punto di vista di O, Psi muove lungo un orbita circolare di raggio r alla velocita rω. Il suo tempo proprio e percioτ = τ0 +

√1− ω2r2/c2t, cosicche P cammina piu lentamente di O e quindi di Oω. Se O a un

dato istante pensa di aver sincronizzato il suo orologio con P , dopo un po’ si accorge che si

Page 222: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 222

desincronizzano.Per assegnare una coordinata temporale sincrona a P , Oω e percio costretto a fornire P di unorologio diverso da Oω, costruito in modo che una volta posto in P appaia camminare allastessa frequenza di O.27 Assegnata tale coordinata temporale a P , e evidente che le coodinatetemporali costruite da O e Oω sono legate dalla relazione t(P ) = tω(P ). Due eventi sono con-temporanei per O se e soltanto se lo sono anche per Oω!Dato che O e Oω concordano sulla contemporaneita, concordano anche sulle misure di lunghez-za gicche misurare la lunghezza di un segmento equivale a registrarne la posizione simultaneadegli estremi. Se quindi i due osservatori dispongono di due regoli identici, essi apparirannoentrambi di pari lunghezza ad ognuno dei due osservatori indipendentemente dalla posizione edall’orientamento dei regoli (ciascuno fermo nel proprio sistema di riferimento).In conclusione dunque Oω con il suo regolo puo costruire un sistema di coordinate spazialicilindriche (rω, φω, zω) che saranno legate alle coordinate cilindriche di O dalla relazione28

tω = t ,rω = r ,

φω = φ− ωt ,zω = z .

La metrica. La metrica minkowskiana nelle coordinate ruotanti assume la forma

ds2 =

(1− ω2r2

c2

)c2dt2ω − dr2

ω − 2r2ωωdφωdtω − r2

ωdφ2ω − dz2

ω .

Come esercizio verifichiamolo nei dettagli. Le coordinate cartesiane inerziali sono per definizionecoordinate (t, x, y, z) per le quali

ds2 = c2dt2 − dx2 − dy2 − dz2 .

Prima di tutto introduciamo delle coordinate cilindriche (t, r, φ, z) tali che x = r cosφ e y =r sinφ. Differenziando si ha

dx = cosφdr − r sinφdφ , dy = sinφdr + r cosφdφ

e ricordando che, ad esempio, dx2 := dx dx, si ha

dx2 + dy2 = (cos2 φdr2 + r2 sin2 φdφ2 − 2r cosφ sinφdr dφ)

+(sin2 φdr2 + r2 cos2 φdφ2 + 2r cosφ sinφdr dφ)

= dr2 + r2dφ2 ,

e quindi la metrica di Minkowski assume la forma

ds2 = c2dt2 − dr2 − r2dφ2 − dz2 .

27Equivalentemente Oω potrebbe mandare a P un impulso al secondo, dicendogli di usare quegli impulsi comeorologio, identificando il primo impulso con tP = (t0 + t1)/2. In altre parole Oω usa esclusivamente il proprioorologio per attribuire la coordinata temporale agli eventi.

28lasciamo come esercizio i dettagli della deduzione

Page 223: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 223

Per esprimerla in termini delle coordinate ruotranti occorre invertire la trasformazione dicoordinate che lega le coordinate cilindriche a quelle ruotanti:

t = tω ,r = rω ,

φ = φω + ωtω ,z = zω ,

dopodiche, differenziando dt = dtω ,dr = drω ,

dφ = dφω + ωdtω ,dz = dzω ,

e sostituendo nella metrica di Minkowski, si ottiene

ds2 = c2dt2 − dr2 − r2dφ2 − dz2

= c2dt2ω − dr2ω − (dφω + ωdtω)2 − dz2

ω ,

che coincide con la tesi.Come si vede le coordinate di Oω sono limitate alla regione rω < c/ω. Si noti che il tem-po proprio di un orologio di posizione spaziale fissa rispetto ad Oω fornito dalla metrica edτ =

√1− r2

ωω2/c2dtω, coincidente con la relazione dedotta da O utilizzando la dilatazione

relativistica. Mentre O interpreta il rallentamento dell’orologio P come un effetto cinematico,Oω lo vede come conseguenza del campo gravitazionale individuato dal potenziale V = gtt

c2− 1

(che in pratica rappresenta il potenziale centrifugo). Cio che e fondamentale non e deciderequale sia la giusta interpretazione, ma piuttosto che entrambi arrivino alla stessa conclusione:gli orologi rallentano! Questa e un’espressione del principio di equivalenza.Base ortonormale, connessione di spin e connessione di Levi-Civita.Una possibile tetrade associata alla metrica e data dalle 1−forme (e0, e1, e2, e3) dove

e0 = cdt = cdtω , e1 = dr = drω , e2 = rdφ = rω(dφω + ωdtω) , e3 = dz = dzω .

Questa tetrade individua in ogni punto dello spazio-tempo un sistema di riferimento ortonormalefisso rispetto a quello di O. Si rammenti che non si tratta di un sistema di coordinate ma diun riferimento per lo spazio tangente nel punto dato. La connessione di spin riemanniana edeterminata dalle equazioni

dei = −ωij ∧ ej , ωij = −ωji .

Si trova immediatamente che gli unici termini non nulli sono ω12 = −ω2

1 = e2

ro anche

ω =

0 0 0 0

0 0 e2

r0

0 − e2

r0 0

0 0 0 0

.

Page 224: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 224

Utilizzando le relazioni in 11.6.14 si ottiene per i simboli di Christoffel nelle coordinate di Oω29

sono date dalle 1−forme Γµν := Γµσνdxσω, dove x0

ω = tω, x1ω = rω, x2

ω = φω, x3ω = zω e

Γ =

0 0 0 0

−ω2rωdtω − ωrωdφω 0 −rωdφω − ωrωdtω 0ωrω

drωωrω

dtω + 1rω

dφω1rω

drω 0

0 0 0 0

.

Mentre sappiamo quale sia il significato geometrico di Γ, e interessante studiarne l’interpre-tazione fisica. Supponiamo che Oω osservi il punto P di coordinate (ctω, rω, φω, zω), fisso nel suoriferimento. Le componenti della quadrivelocita di P calcolata rispetto al tempo misurato dalproprio orologio sono uµ = (1, 0, 0, 0) in ogni istante. Tuttavia per confrontare uµ(tω + δtω) conuµ(tω) egli deve portarlo in tale punto tramite Γ. Lo spostamento infinitesimo e rappresentatodal vettore δ := −δtω ∂

∂tωsicche

uµ(tω + δtω) 7−→ uµ(tω + δtω) + Γ(δ)µνuν(tω + δtω)

ed essendo

Γ(δ) =

0 0 0 0

ω2rωδtω 0 ωrωδtω 00 ω

rωdtω 0 0

0 0 0 0

,

ovvero δuµ = (0, ω2rωδtω, 0, 0). Il punto P appare dunque soggetto ad una accelerazione radialeω2rω, l’accelerazione centrifuga, che Oω potrebbe interpretare come un campo di forze gravi-tazionali. Se in P vi fosse situata una masserella m, essa dovrebbe percio essere trattenuta daP con una forza −mδur/δτ , essendo τ il tempo proprio misurato da P , cioe

~f = −m ω2rω√1− ω2r2

c2

ur ,

essendo ur il versore radiale. In particolare tale forza diverge all’avvicinarsi di rω al suo valorelimite c/ω, rendendo evidente la difficolta di una realizzazione fisica del sistema ruotante. Similianalisi possono essere fatte per interpretare le restanti componenti di Γ.

11.6.23 Sistemi inerziali comoventi e la precessione di Thomas. Vogliamo ora consid-erare il punto di vista di O mentre osserva il suddetto punto P fermo nel sistema di Oω. PoicheO e inerziale, ha una predilezione per i sistemi inerziali cosicche, nel considerare il moto di P ,lo confronta istante per istante con il sistema inerziale comovente con P . Ricordiamo che Ogia disponeva di una tetrade di riferimenti ei, che pero non sono comoventi con P ma piuttostocon O. Da questa si ottiene la tetrade dei sistemi comoventi semplicemente con un boost (in

ogni punto) in direzione uφ di velocita v = ωr. Posto γ = (1 − ω2r2)−12 ,30 il boost e generato

29ovviamente sono nulli nelle coordinate di O30in questa ultima parte scegliamo le unita in cui c = 1 per alleggerire le formule

Page 225: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 225

dalla matrice Λ ∈ G = SO(1, 3)

Λ =

γ 0 −ωrγ 00 1 0 0−ωrγ 0 γ 0

0 0 0 1

,

cosicche, usando le osservazioni in 11.6.14 si ha

e0 = γ(e0 − ωre2) , e1 = e1 , e2γ(e2 − ωre0) , e3 = e3

e

ω = Λ−1ωΛ + Λ−1dΛ =

0 γωe2 −γ2ωe1 0

γωe2 0 γre2 0

−γ2ωe1 −γre2 0 0

0 0 0 0

.

La particella P porta con se il sistema di riferimento individuato in ogni punto dai vettori ∂∂tω

,∂∂rω

, ∂∂φω

, ∂∂zω

le cui componenti rispetto al sistema ortonormale di vettori duali alle tetradi ei e

ei sono dati dai coefficienti eiµ e eiµ rispettivamente, cioe

∂tω≡

10rω0

,∂

∂rω≡

0100

,∂

∂φω≡

00r0

,∂

∂zω≡

0001

,

rispetto ad ei e

∂tω≡

000

,∂

∂rω≡

0100

,∂

∂φω≡

−ωr2γ

c

0rγ0

,∂

∂zω≡

0001

,

rispetto a ei. Questi vettori rappresentano il sistema di riferimento associato alla particella dallecoordinate ruotanti, visti da O e dalla famiglia di sistemi inerziali comoventi rispettivamente.Nello spostamento di P lungo il tratto δ = (δt, 0, ωδt, 0) dell’orbita, secondo O31 le componentivi di un vettore nel dato punto subiranno una variazione −ω(δ)ijv

j rispetto al riferimento nelmedesimo punto. Dunque secondo O

δ∂

∂tω≡

0

−ω2rδt00

, δ∂

∂rω≡

00ωδt0

, δ∂

∂φω≡

0

−ωrδt00

, δ∂

∂zω≡

0000

.

31ripetendo il ragionamento precedentemente fatto con Γ, ma questa volta utilizzando ω

Page 226: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

11 STRUTTURE GEOMETRICHE 226

Un osservatore comovente registrera invece la variazione

δ∂

∂tω≡

0

−ω2rδt00

, δ∂

∂rω≡

−ω2γrδt

0γωδt

0

, δ∂

∂φω≡

0

−ωγrδt

00

, δ∂

∂zω≡

0000

.

Per confrontare con le sue misure O deve applicare il boost inverso Λ−1, ottenendo

δ∂

∂tω≡

0

−ω2rδt00

, δ∂

∂rω≡

00ωγδt

0

, δ∂

∂φω≡

0

−ωγrδt

00

, δ∂

∂zω≡

0000

.

Come si vede dunque O vede una discrepanza tra la sua misura e quella fatta da O, checorrisponde ad una rotazione degli assi urω e uφω attorno all’asse uz di un angolo

δθ = ω

(1

γ− 1

)dt = ω(1− γ)dτ .

In altre parole secondo O la particella P nel muoversi subisce rispetto ai sistemi comoventi unmovimento di precessione lungo l’asse z, con velocita di precessione ωp = ω(1 − γ) rispetto altempo proprio. Tale fenomeno relativistico e noto come precessione di Thomas. Alcuni autoriattribuiscono tale fenomeno al fatto che nel moto accelerato della particella vengono a mancarele proprieta pseudoeuclidee dello spazio-tempo. Tuttavia abbiamo visto invece che si tratta diun fenomeno relativo da attribuire alle differenti descrizioni della connessione metrica euclideasecondo le differenti scelte fatte sul fibrato dei riferimenti dello spazio piatto di Minkowski.In particolare non abbiamo affatto dovuto modificare la metrica di Minkowski, ma solamenteesprimerla in coordinate differenti e utilizzare in maniera adeguata la descrizione sul fibrato deiriferimenti. Tuttalpiu puo essere attribuito al fatto che lo spazio delle velocita non e euclideo,ma e piuttosto uno spazio di Lobachewski.

Page 227: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 227

12 Teoria dinamica delle simmetrie.

Testi consigliati: [CDF], [N1], [N2].Vogliamo ora considerare un’interpretazione fisica dei concetti introdotti nel capitolo 11.

Questo verra fatto da un punto di vista classico o tuttalpiu in prima quantizzazione, dove tuttii campi in gioco sono comunque classici. Assumeremo inoltre che i gruppi in gioco siano sempredei gruppi di Lie.

12.1 Campi di materia.

Cominciamo a descrivere una certa classe di campi che chiameremo campi di materia.

12.1.1 Simmetrie esterne ed interne. Su una varieta M si consideri un campo, terminecon il quale intenderemo qui la funzione d’onda che descrive un qualche tipo di particella.La natura esatta del campo (scalare, vettoriale,. . .) dipendera dal gruppo di struttura e dallarispettiva rappresentazione. Si puo ad esempio pensare che si tratti della funzione d’onda diuna particella su M . Qui M puo essere lo spazio-tempo (in una teoria relativistica ad esempio)o solamente lo spazio (nel caso non relativistico).Dal punto di vista pratico un campo di materia e semplicemente una mappa da un certo intornolocale a valori in uno spazio vettoriale:

ψ : U −→ V ,

ad esempio V = C se si tratta del campo di Schrodinger di una particella senza spin. Dalpunto di vista matematico si tratta della sezione di qualche fibrato vettoriale: ψ ∈ Γ(M, ξ),ξ = (E, π,M,G, (ρ, V )). La descrizione locale del campo puo essere fatta scegliendo una cartalocale (U, φ) nell’atlante di M . Allora esistera una mappa Φ : π−1(U) −→ φ(U) × V , conφ = π1 Φ32, tramite la quale si ottiene la descrizione locale ψU : O −→ V , dove abbiamo postoO := φ(U) ⊂ Rn e ψU = π2 Φ ψ φ−1. Tale descrizione semplificata del campo ci permettedi introdurre in forma elementare il seguente problema.Nel descrivere una situazione fisica si ricorre spesso al concetto di simmetria. Vediamo cosa siintende nel caso semplice in cui il campo sia la mappa

ψU : O −→ V .

Supponiamo che un osservatore stia descrivendo un certo sistema fisico in una regione O attornoa lui, tramite il campo ψU . Il modo piu semplice in cui puo manifestarsi una simmetria e tramiteil fatto che la sua descrizione non dipenda sempre dal modo in cui lui osserva il sistema.Per esempio potrebbe accadere che guardandosi attorno, senza alzare o abbassare lo sguardo,la descrizione del mondo circostante rimanga sempre la stessa. Egli dira che tale mondo esimmetrico per rotazione attorno al proprio asse. Naturalmente la conclusione non dipende dalfatto che sia lui a ruotare su se stesso o sia il sistema a ruotare attorno a lui. Il primo e dettopunto di vista passivo, mentre il secondo e il punto di vista attivo. Il punto di vista attivo mette

32π1 e π2 sono le due proiezioni naturali sul primo e secondo fattore del prodotto cartesiano.

Page 228: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 228

in evidenza il fatto che la rotazione debba mandare O in se stesso. L’osservatore dira allora chele rotazioni sono trasformazioni di simmetria. Resta da specificare cosa si intenda dicendo chela descrizione resta la stessa. Dato che l’unico modo di testare il mondo fisico e tramite dellemisure, la trasformazione deve lasciare invariate le quantita misurabili. Se ad esempio ψU(x) eosservabile e R : O −→ O e una trasformazione di simmetria, dovra aversi ψU(x) = ψU(R(x)).Chiaramente se due trasformazioni sono trasformazioni di simmetria, anche la loro composizionelo e e dunque l’insieme di tutte le trasformazioni di simmetria formano un gruppo, detto gruppodi simmetria.Esiste tuttavia un secondo tipo di trasformazioni di simmetria, che lasciano cioe invariate leosservabili fisiche. Si tratta delle trasformazioni di V , cioe T : V −→ V . Per esempio se ψUe una funzione d’onda per una particella scalare non relativistica, allora la trasformazione difase ψU(x) 7→ eiαψU(x) e una tale simmetria. In particolare diremo che e locale o globale aseconda che α dipenda o meno dal punto x. Queste trasformazioni si dicono interne, dato chenon sono associate direttamente ad una trasformazione geometrica dello spazio osservabile O,ma piuttosto allo spazio astratto V sul quale l’osservatore non puo agire direttamente. V etalvolta detto spazio interno per ψU . Per contro il primo tipo di simmetrie si dicono esterne.Piu in generale le trasformazioni esterne si mischieranno con quelle interne.

12.1.2 Trasformazioni. Sia Eπ−→ M un fibrato su M . Chiamiamo trasformazione del

fibrato un diffeomorfismo T : E −→ E che rispetti la struttura delle fibre, cioe tale che

• τ := π T π−1 : M −→M e un diffeomorfismo;

• T |Ex : Ex −→ Eτ(x) e un isomorfismo tra le fibre.33

Diremo che la trasformazione e interna se τ e l’identita (cioe se T e un isomorfismo di fibrati).Una trasformazione dei fibrati induce una trasformazione dei campi associati, T : Γ(M,E) −→Γ(M,E), definita da T ψ = T ψ τ−1 per ogni ψ ∈ Γ(M,E). Si chiama trasformazione esternadel campo ψ la trasformazione ψ 7→ τ∗ψ, indotta da un diffeomorfismo τ : M −→M . E chiaroche ogni trasformazione puo allora essere decomposta in trasformazioni interne ed esterne.

12.1.3 Osservazione. La definizione precedente puo essere indebolita osservando che nelladescrizione fisica non e a priori necessario fissare un determinato fibrato: un altro fibratoisomorfo andrebbe altrettanto bene. Percio una trasformazione puo essere definita come undiffeomorfismo T : E −→ E tra due fibrati isomorfi. In questo senso e naturale pensare alletrasformazioni come simmetrie del sistema, nel senso che mandano un fibrato in un altro,potenzialmente equivalente per descrivere la fisica. Il ’potenzialmente’ sottolinea il fatto chel’equivalenza non e ancora garantita. Infatti la fisica non e descritta solamente dagli oggetti(i campi e i fibrati), ma anche dalle relative equazioni del moto che caratterizzano il sistema.Una simmetria deve quindi rispettare anche le equazioni del moto.

33Un isomorfismo lineare se il fibrato e vettoriale, di gruppi se e un fibrato principale e cosı via.

Page 229: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 229

12.1.4 Significato. In una descrizione locale Φ : π−1(U)'−→ U × V , una trasformazione

interna sara determinata da una funzione locale

f : U × V −→ V ,

in modo che la trasformazione sara descritta dall’applicazione

(x, v) 7→ (x, f(x, v)) .

Tale applicazione deve agire linearmente sulla fibra,34 e poiche le trasformazioni formano ungruppo, la funzione f si riduce a sua volta ad un’applicazione

T : U −→ Aut(V ) ,

a valori negli automorfismi di V cosicche

f(x, v) = T (x)v .

Il sottogruppo di Aut(V ) generato dalle trasformazioni T (x) , x ∈ U realizza un gruppo U , ingenerale diverso dal gruppo di struttura G. Possiamo sempre pensare a questo come alla rapp-resentazione di U sulla fibra Ex ' V . Viceversa dato un gruppo U e una sua rappresentazionesu V , possiamo costruire un gruppo di trasformazioni con la procedura inversa. Data cioe unamappa

f : U −→ U ,

la trasformazione sara descritta dall’applicazione

(x, v) 7→ (x, ρ(f(x))(v)) .

Per capire ancora meglio il significato delle trasformazioni, supponiamo supponiamo che V ' R3

e U sia il gruppo delle rotazioni. Sia poi R la rappresentazione di U su V . La trasformazione

(x, v) 7→ (x,R(f(x))(v)) ,

corrisponde allora a far ruotare V tramite una rotazione R(f(x)). Poiche tale rotazione dipendedal punto x dobbiamo pensare che per ogni x lo spazio V subisca una rotazione diversa perogni punto. Questo giustifica il fatto che sia conveniente pensare alla trasformazone agentesu una copia diversa Ex ' V di V per ogni punto e ai campi come a delle funzioni a valoriin U × V =

∐x∈U Ex anziche in V . La struttura di fibrato e dunque quella piu naturale per

descrivere le trasformazioni.Osserviamo che comunque, a differenza del gruppo di struttura G, il gruppo di trasformazioniU non lascia invariati i vettori di E ne tantomeno le sue sezioni. Il fibrato che occorre costruireper poter descrivere dei campi di E soggetti a trasformazioni non e dunque in generale lo stessodi E. Sia allora Υ il fibrato principale con gruppo U . Possiamo procedere in due modi. Se P eil fibrato principale con gruppo G sotteso da E, si puo costruire il fibrato principale P ⊗Υ su

34consideriamo campi vettoriali

Page 230: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 230

cui agiscono sia G che U , e quindi ricostruire il fibrato E con la struttura arricchita. Tuttaviadal punto di vista fisico, dovendo distinguere tra i campi vettoriali rispetto alla struttura G ele U−trasformazioni, conviene adottare la corrispondenza individuata nella sezione 11.4.9.

12.1.5 Campi di materia e trasformazioni di gauge. Chiamiamo campo di materiacalibrabile o gauge covariante su E una mappa equivariante φ : Υ −→ E, tale che πE φ = πΥ.Equivariante significa che e equivariante su ogni fibra.Lasciamo come utile esercizio la verifica del fatto che una trasformazione interna di un campodi materia su E e allora indotta da una trasformazione di Υ. A tale scopo si introduca unadescrizione locale di E e Υ indotta da una carta locale (U, φ) dell’atlante di M e si descriva latrasformazione interna di un campo osservando che l’azione di U sulle fibre di Υ e transitiva.Si chiama scelta del gauge o calibrazione la scelta di una sezione σ ∈ Γ(M,Υ). In tal caso sidice che la sezione φσ := φ σ ∈ Γ(M,E) rappresenta il campo φ nel gauge fissato. La trasfor-mazione che corrisponde al passaggio da una sezione σ ad una seconda sezione σ si chiamatrasformazione di gauge o ricalibrazione.In una descrizione locale σ e individuata da una funzione (che continuiamo a chiamare)σ : U −→ U , cosicche esistera una funzione f : U −→ U tale che σ(x) = σ(x)f(x)−1 perogni x ∈ U . Allora, sempre nella descrizione locale, avremo φσ = (ρ f)(φσ).Come abbiamo osservato in precedenza, le trasformazioni di gauge vengono promosse a sim-metrie di gauge se sono delle simmetrie, ed in particolare se lasciano invariate (o covarianti)le equazioni del moto. Si noti che la seconda condizione e in generale piu debole della prima:essa significa che la trasformazione di gauge manda una soluzione delle equazioni del moto inun’altra soluzione, ma non e detto che la nuova soluzione abbia lo stesso significato fisico dellavecchia, come invece pretende una simmetria. Se la soluzione e una nuova soluzione fisica sidice che la trasformazione e una dualita.Nelle teorie di gauge comunque si assume come principio che le trasformazioni di gauge sianosimmetrie, cosicche solo alle quantita invarianti per trasformazioni di gauge, detti gli invariantidi gauge, viene attribuito un significato fisico.

12.2 Campi di gauge.

Le equazioni del moto per i campi di materia in una teoria di gauge devono essere scritte informa covariante. Un modo naturale per farlo e di scriverle in termini di derivate covarianti,come mostrato nel capitolo 11. Tuttavia, prima di procedere in via sistematica, vogliamoillustrare il punto di vista euristico dei fisici.

12.2.1 Costruzione euristica dei campi di gauge. Consideriamo dapprima un esempioparticolarmente semplice. Sia M = R3,1 lo spazio-tempo di Minkowski e φ : M −→ C uncampo scalare, al quale non diamo alcun significato particolare, ma semplicemente assumiamoche tutte le quantita misurabili siano funzioni di φ(x)∗φ(x) = |φ(x)|2 e delle quantita conservateassociate all’azione

S[φ] =

∫M

ηµν∂µφ∗(x)∂νφ(x)d4x .

Page 231: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 231

Si osservi che allora l’azione e invariante per trasformazioni di fase costante

φ 7→ eiαφ

dove α : M −→ R e una mappa costante.Usando il teorema di Noether35 si trova la corrente conservata jµ(x) = i(φ(x)∗∂µφ(x) −φ(x)∂µφ(x)∗) che infatti, per ogni φ che risolve le equazioni del moto, soddisfa ∂µj

µ = 0. Fissatoun sistema di riferimento (ct, x1, x2, x3) e una fissata regione spaziale V di bordo S = ∂V fissanel dato riferimento si ha percio

d

dt

∫V

j0(x)d3x =

∫V

∂tj0(x)d3x = −c

∫V

∂ljld3x = −c

∮S

jl(x)nl(x)dσ,

in cui abbiamo dapprima utilizzato l’equazione di continuita ∂µjµ = 0 e poi il teorema di

Stocks. In particolare l si somma da 1 a 3 e ~n e il versore normale alla superficie e sσ l’elementodi superficie. Dunque la quantita Q :=

∫Vj0d3x si conserva nel tempo se non vi e flusso

di ~j attraverso la superficie. Si noti che, come doveva essere, anche la corrente conservata einvariante per la trasformazione di fase costante.Vogliamo ora chiederci cosa accade se facciamo una trasformazione di fase dipendente dal punto,in cui cioe α ∈ C∞(M) non sia piu costante. In primo luogo non e piu conveniente pensare alcampo come ad una funzione a valori complessi, ma piuttosto come una sezione

φ : M −→M × C , tale che π1 φ = idM .

In questo modo, posto Cx := π−11 (x) ' C, avremo M × C :=

∐x∈M Cx e potremo pensare

alla trasformazione di fase φ 7→ eiαφ come associata ad una diversa rotazione di fase di angoloα(x) per ciascun piano complesso Cx. Questo mette in luce la struttura di fibrato necessaria.Tuttavia la trasformazione ottenuta non e una simmetria poiche non lascia invariata ne l’azionene le equazioni del moto. Per vedere come modificare la teoria per renderla una teoria digauge analizziamo in che modo risulta violata l’invarianza e come possa essere ripristinata. Perfarlo, generalizziamo un po’ l’esempio, assumendo che φ abbia valore in Cn e che la simmetriaoriginale sia φ 7→ gφ, dove g : M −→ G e una funzione costante a valori nel sottogruppo Gdi U(n,C)36. Per rendere locale la simmetria assumiamo dunque che g non sia piu costante.L’azione sia semplicemente

S[φ] =

∫M

ηµν〈∂µφ(x), ∂νφ(x)〉d4x ,

scritta in termini del prodotto hermitiano in Cn. Vediamo subito che l’invarianza dell’azionecade a causa del semplice fatto che

∂µ(g(x)φ(x)) 6= g(x)∂µφ(x) .

35o direttamente dalle equazioni del moto

ηµν∂µ∂νφ = 0

36l’esempio originale si riottiene allora per n = 1

Page 232: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 232

Per ripristinare la simmetria occorre ripristinare tale proprieta. Bisogna cioe covariantizzare laderivata. A ∂µ bisogna sostituire una nuova derivata Dµ covariante. Nel linguaggio di 12.1.5diremo che se φ(x) = g(x)φ(x) rappresenta la trasformazione di gauge, allora anche la derivataDµ deve trasformarsi in Dµ in modo che valga

Dµφ(x) = g(x)Dµφ(x) ,

cioe la derivata (trasformata) del trasformato deve essere pari al trasformato della derivata. Inaltre parole, esattamente come avviene per φ, Dµ sara solo l’espressione nel gauge fissato delladerivata. Se la condizione suddetta e soddisfatta, otteniamo una teoria di gauge semplicementesostituendo Dµ a ∂µ.Cerchiamo ora di capire come debba essere fatta l’espressione locale (cioe nel dato gauge) delladerivata Dµ. Possiamo scrivere Dµ = ∂µ + Aµ(x), dove

Aµ(x) : Cn −→ Cn

sara un qualche operatore lineare che deve agire sul campo φ. Nel nuovo gauge avremo inveceDµ = ∂µ + Aµ(x). Imponendo la suddetta condizione di covarianza otteniamo che deve essere

Aµ(x) = g(x)Aµ(x)g(x)−1 − g(x)−1∂µg(x) .

Questa relazione ci dice come deve essere fatto l’operatore Aµ(x). Se U e il gruppo di trasfor-mazioni allora g(x)−1∂µg(x) ∈ Lie(ρ(U))37 e quindi Aµ e localmente un campo a valori inLie(U), ed agisce sul campo φ tramite la rappresentazione di Lie(U) indotta da ρ. TuttaviaAµ non e un campo di materia, poiche sotto trasformazioni di gauge non trasforma come unasezione, a causa del termine additivo g(x)−1∂µg(x). Per tale motivo Aµ viene invece chiamatocampo di gauge.

12.2.2 Osservazione. Nel caso in cui il gruppo di gauge sia U(1) allora iAµ avra valori in R ealla trasformazione di fase con angolo α corrisponde la trasformazione di gauge iAµ = iAµ+∂µα.Dunque iAµ si comporta esattamente come il quadripotenziale del campo elettromagnetico!Questa affermazione induce a dare proprio tale interpretazione ad Aµ. In tal caso sappiamorendere dinamico Aµ associandovi il campo di forze Fµν = ∂µAν − ∂νAµ e la relativa azione

S[A] = κ

∫M

FµνFµνd4x .

Da questo punto di vista possiamo dire che i campi di gauge e i relativi campi di forze sonoconseguenza del fatto che si siano rese locale delle simmetrie globali. In un certo senso sono ilmanifestarsi di una simmetria che per qualche motivo non puo essere globale. Si osservi ancheche Fµν in questo caso e invariante di gauge e quindi e osservabile, a differenza di Aµ.Prima di considerare il caso di un gruppo generico, torniamo all’interpretazione geometricarigorosa.

37dove ρ e la rappresentazione di U su V

Page 233: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 233

12.2.3 Connessione e campi di gauge. Consideriamo il fibrato principale delle trasfor-mazioni di gauge Υ. Sia T : Υ −→ Υ una trasformazione di gauge, cioe un automorfismo diΥ che induce l’identita su M . Per descrivere tale trasformazione osserviamo che T determinaunivocamente una funzione equivariante αT : Υ −→ G, cioe tale che

αT (ξg) = Adg−1(αT (ξ))

per ogni ξ ∈ Υ e g ∈ G. Infatti, per definizione, T manda ogni fibra in se, sicche se ξ ∈ Υx

allora si ha T (ξ) ∈ Υx. D’altra parte G agisce transitivamente e liberamente su ogni fibra, equindi deve esistere un unico g ∈ G tale che T (ξ) = ξg. Tale g e univocamente determinato daξ e T e quindi possiamo definire αT (ξ) := ξg, cioe

ξαT (ξ) =: T (ξ) .

D’altra parte la trasformazione deve essere compatibile con l’azione a destra, cioe T (ξh) = T (ξ)hper ogni h ∈ G. Da cio segue che αT e equivariante:

(ξh)αT (ξh) = (ξαT (ξ))h =⇒ αT (ξh) = h−1αT (ξ)h .

Viceversa, una mappa equivariante α : Υ −→ G determina univocamente una trasformazioneTα : Υ −→ Υ. Basta porre Tα(ξ) = ξα(ξ).

Su Υ possiamo introdurre una connessione infinitesima ω con la quale definire una derivatacovariante ∇ω che agisca sui campi di materia, come introdotto in 11.3.12 e 11.4.11. Vogliamoinnanzitutto vedere quale sia l’effetto di una trasformazione T sulla connessione.

12.2.4 Proposizione. La 1−forma T ∗ω e ancora una connessione infinitesima su Υ e si ha

T ∗(ω)ξ = AdαT (ξ)−1(ωT (ξ)) + dLα−1T (ξ)) dαT (ξ) .

Qui abbiamo usato il pedice ξ per indicare la valutazione nel punto ξ ∈ Υ.

Dimostrazione. Diamo una traccia della dimostrazione.Per verificare la formula per T ∗(ω)ξ basta applicare T ∗(ω)ξ ad un campo vettoriale Ψ su Υusando T ∗(ω)ξ(Ψ(ξ)) = ωξ(T∗(Ψ)(ξ)) e T (ξ) = ξαT (ξ) per calcolare il push forward, doveusiamo ξg per Rg(ξ).Una volta verificata la formula, si verifichi che l’espressione nel membro di destra soddisfa leproprieta di una connessione infinitesima. 2

La mappadLα−1

T (ξ) dαT (ξ) : TξΥ −→ Lie(G)

viene usualmente indicata con αT (ξ)−1dαT (ξ) e chiamata derivata logaritmica di αT .Naturalmente

dLα−1T (ξ) : TαT (ξ)U −→ TeG

e l’azione a sinistra su TG (ristretta ad αT (ξ)) indotta dalla moltiplicazione a sinistra sulgruppo.

Page 234: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 234

Sia (U, φ) una carta locale. Supponiamo ora di fissare un gauge σ ∈ Γ(U,Υ). Questa eun’operazione che puo essere fatta solo localmente. Il motivo e che in generale un fibratoprincipale e banale se e solo se ammette una sezione globale38. Dunque non esistono sezioniglobali se il fibrato non e banale. Detto cio, potremo definire la connessione locale nel gaugefissato come A := ω σ. Si tratta di una 1-forma a valori in Lie(G). Cosa accade se cambiamogauge, cioe se passiamo da σ a σ ∈ Γ(U,Υ)? Il cambiamento puo evidentemente essere vistocome indotto da una trasformazione del fibrato Υ|U e quindi sara descritto allora da unamappa equivariante αT cioe σ(x) := Tσ(x) = σ(x)αT (σ(x)) =: σ(x)g(x). Nel nuovo gauge laconnessione locale A sara allora legata ad A dalla relazione A = T ∗A ed applicando la regoladi trasformazione della proposizione otteniamo

A(x) = g(x)−1A(x)g(x)− g(x)−1dg(x) ,

che e proprio la formula dedotta euristicamente dal punto di vista fisico. Basta inoltre applicare11.4.11 per verificare che la derivata covariante Dµ e semplicemente l’espressione locale delladerivata covariante geometrica ∇ω sui campi di materia.Si noti in particolare che il campo A visto come un campo su M e ben definito solo localmente,mentre l’oggetto globale e ω che vive su Υ. Questo mostra l’importanza del concetto di fibratonella costruzione delle teorie di gauge.

12.2.5 Curvatura e campo di forze. Data la connessione infinitesima ω su Υ, possiamoanche considerarne la forma di curvatura Ω = H(dω). L’equazione di struttura (sezione 11.5.3)ci dice allora che Ω = dω+ 1

2[ω, ω]. Scelto un gauge locale σ possiamo introdurre il concetto di

curvatura locale F := Ωσ = Ωσ. Allora F = dA+ 12[A,A] e una 2-forma a valori in Lie(G). In

particolare se G = U(1) allora F = dA e il tensore di Faraday. Dunque la forma di curvaturarappresenta il campo di forze o fieldstrength associato al campo di gauge.E un semplice esercizio verificare che in una trasformazione di gauge il campo di forze trasformasecondo la rappresentazione aggiunta: se σ(x) = σ(x)g(x) allora F (x) = dAdg(x)(F (x)).39 Ineffetti si tratta dell’espressione locale della seguente proposizione di facile dimostrazione.

12.2.6 Proposizione. Sia T : Υ −→ Υ una trasformazione di gauge. Se Ω e la forma dicurvatura associata ad ω allora T ∗Ω e la forma di curvatura associata a T ∗ω e si ha

T ∗Ωξ = dAdαT (ξ)−1 ΩT (ξ) .

12.3 Teorie di Yang-Mills.

Riassumendo, il campo di gauge e geometricamente individuato dalla connessione infinitesimasul fibrato principale, mentre il campo di forze e individuato dalla forma di curvatura. L’inter-azione di tali campi con i campi di materia avviene tramite l’azione della derivata covariante ∇ω

e del corrispondente campo di curvatura Ω∇ sui campi di materia. Si noti che in un particolaregauge avremo ad esempio ∇µφ(x) = ∂µφ+ ρ(A(x))φ(x), dove ρ e la rappresentazione di Lie(G)

38la dimostrazione e un esercizio39ovviamente dAdg e l’azione aggiunta del gruppo sull’algebra ottenuta differenziando Adg : U −→ U

Page 235: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 235

su V . Se inoltre fissiamo una base τana=1 dell’algebra di Lie di G, con costanti di strutturacbc

a, allora A = Aaτa, F = F aτa e

F aµν = ∂µA

aν − ∂νAaµ + cbc

aAbµAcν .

Ovviamente dal punto di vista fisico e conveniente identificare il campo di forze con Ω∇ che vivesu M , anziche con Ωω che vive su Υ.40. In tal senso il campo di forze e globalmente definitosu M , a differenza del campo di gauge. In questo senso il campo di forze appare piu fisicodel campo di gauge che rappresenta piuttosto un ’potenziale’ per il campo di forze. Tuttaviapossiamo notare che solamente se il gruppo di gauge e abeliano il campo di forze e invariantedi gauge. Nel caso non abeliano F trasforma con l’aggiunta e non e direttamente osservabile.Lo saranno piuttosto le quantita invarianti che si possono costruire a partire da F .

12.3.1 Interazioni di gauge.L’accoppiamento tra connessione e campi di materia ha come effetto secondario un’inter-

azione tra i campi di materia mediata dai campi di gauge, detta anche interazione di gauge.Per esempio nel caso eletromagnetico possiamo dire che l’interazione elettromagnetica tra campicarichi41 e mediata dal quadripotenziale Aµ. Abbiamo visto come nel caso abeliano sia possi-bile rendere dinamico il campo di gauge introducendo un’azione quadratica nel campo di forze:S[A] = κ

∫FµνF

µνd4x. Nel caso nonabeliano tale espressione non e invariante di gauge, ma loe la sua traccia. Dunque su una varieta (pseudo-)metrica ha senso definire almeno localmente

SU [A] = κ

∫U

TrFµν(x)F µν(x)√g(x)d4x ,

dove g(x) e il modulo del determinante della matrice metrica, (U, φ) una carta locale e latraccia e presa nella rappresentazione aggiunta (composta con la rappresentazione ρ). Se U eun secondo aperto locale che ha intersezione non vuota con U allora sull’intersezione F ed Fdifferiranno per una trasformazione di coordinate composta con una trasformazione di gauge.Chiaramente l’integrale con la misura indotta dalla metrica non dipende dalla scelta dellecoordinate. Poiche la trasformazione di gauge corrisponde all’azione aggiunta del gruppo su Fe dato che la traccia e invariante sotto tale azione, si ha allora

SU [A]|U∩U = SU [A]|U∩U .

Quindi le due azioni locali sono compatibili ed e possibile determinare una partizione dell’unitaassociata all’atlante di M e definire quindi SM [A]. In assenza di altri termini, le equazioni delmoto conseguenti sono dunque42

0 =δSM

δAµ(x)a= −4κKab∂ν(

√g(x)F bνµ(x)) ,

40sappiamo pero che sono equivalenti41diremo che un campo di materia e carico se trasforma in maniera non banale sotto trasformazioni di gauge42calcolata ad esempio scegliendo una variazione δAaµ a supporto compatto in U

Page 236: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 236

dove Kab = Tr(τaτb) e la metrica di Killing sull’algebra di Lie del gruppo di gauge. Inoltre Fdeve soddisfare le identita di Bianchi 11.5.4 che assumono la forma43

DaµFνρ(x) +Da

ρFµν(x) +DaνFρµ(x) = 0 ,

dove si e postoDaµFνρ(x) := ∂µF

aνρ(x) + cbc

aAbµ(x)F cνρ(x) .

Le teorie di gauge la cui dinamica viene definita dall’azione quadratica teste definita si chiamanoteorie di Yang-Mills. Se il gruppo di gauge e abeliano si riducono essenzialmente alla teoriadel campo elettromagnetico, per cui ci si riferisce al caso non-abeliano quando si parla di teoriedi Yang-Mills. Si noti che in tal caso l’azione SM [Aa] non e quadratica nei campi ma contieneanche termini cubici e quartici.44 Dal punto di vista fisico questo significa che nemmeno inassenza di sorgenti i campi di gauge non-abeliani soddisfano il principio di sovrapposizione, acausa dei termini cubici e quartici che si interpretano allora come termini di autointerazione.Questa interprtazione e chiara dal punto di vista perturbativo in cui i termini non lineari nelleequazioni del moto vengono considerati perturbativamente. Posto allora F a

(0),µν := ∂µAaν−∂νAaµ,

le equazioni del moto assumono la forma ∂µFaµν(0) = jaν , dove jaν contengono termini quadratici

e cubici nei campi di gauge e a livello perturbativo definiscono la sorgente per il campo F a(0),µν .

E interessante comunque osservare che esistono tecniche per determinare e descrivere soluzioniesatte di queste equazioni che, oltre a permettere di descrivere fenomeni non perturbativi infisica, introducono una piu profonda interazione tra fisica e matematica. Ci limiteremo invecea concludere le nostre considerazioni sulle teorie di Yang-Mills con alcune osservazioni.

12.3.2 Osservazioni. Scelta una base τa dell’algebra di Lie asociata al gruppo di gauge,anziche parlare di campo di gauge Aµ, in fisica si preferisce parlare di campi di gauge Aaµ. Adesempio se il gruppo di gauge e SU(n), ci saranno n2 − 1 campi di gauge. Un solo campo perU(1) (il fotone), tre per SU(2) (la luce pesante Z,W±), otto per SU(3) (i gluoni). Ad ognicampo di gauge e associata una carica, che chiameremo carica di gauge in generale ma cheassume il nome specifico di carica elettrica, elettrodebole e di colore nei casi sopra citati.Consideriamo un campo di materia φ su cui agisca un gruppo compatto K (di Lie) come gruppodi gauge, in qualche rappresentazione ρ. Se il gruppo e compatto allora si puo sempre scriverelocalmente la trasformazione di gauge nella forma φ(x) = e

∑a qaα

a(x)τaφ(x). Le costanti qa sonoappunto le cariche del campo, che determinano come il campo si trasforma sotto l’azione delgruppo. In particolare la connessione infinitesima sara ragionevolmente scritta, dal punto divista fisico, nella forma

ω σ(x) =∑a

qaτaAa ,

dove σ e il gauge fissato. Si noti che alcune delle cariche possono essere nulle, tuttavia quellenon nulle devono corrispondere ad una sottoalgebra dell’algebra di Lie. In tal caso la teoriadi gauge si riduce al sottogruppo corrispondente. In ogni caso possiamo pensare alle cariche

43verificare!44si scriva esplicitamente SM [A] in termini di Aaµ

Page 237: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 237

come dei parametri che determinano la rappresentazione con la quale la connessione (che havalori nell’algebra del gruppo di gauge) agisce sul campo di materia. Tali cariche dipendonocomunque dal campo di materia e non dal campo di gauge la cui natura e fissata.Infine osserviamo che finora abbiamo parlato di gruppo di gauge riferendoci al gruppo di Liecompatto indotto su ogni fibra. Tuttavia piu propriamente il gruppo di gauge e il gruppo delletrasformazioni del fibrato principale e si tratta dunque di un gruppo di Lie infinito dimensionale,ben piu complicato dei gruppi di Lie da noi considerati.

12.4 Simmetrie esterne e relativita.

Finora abbiamo considerato le simmetrie che riguardano le trasformazioni dello spazio interno,che costituisce parte della definizione dei campi. Tuttavia un ruolo non meno importante cel’hanno le trasformazioni esterne, che riguardano cioe lo spazio-tempo. Esse infatti sono deter-minanti nella costruzione stessa dei campi e non solo nella loro dinamica e sono ovviamente ifondamenti delle teorie relativistiche. Nel capitolo 13 vedremo ad esempio il ruolo della rela-tivita ristretta nella determinazione dei campi fondamenteli e delle relative equazioni del motoche trovano posto nel modello standard delle particelle elementari, il cui contenuto geometricoverra illustrato nel capitolo 14. In questa sezione ci occuperemo invece di alcuni aspetti dellarelativita generale.

12.4.1 Relativita generale e leggi fisiche. Mentre in relativita ristretta si privilegianoi sistemi di riferimento inerziali, nella relativita generale non viene privilegiato alcun sistemadi riferimento. Poiche costruire un sistema di riferimento in una regione dello spaziotempocorrisponde a introdurvi un sistema di coordinate locali, le equazioni fisiche devono essere nellaloro essenza indipendenti dalla scelta delle coordinate. In altri termini le equazioni fisiche vannoscritte in forma tensoriale (covariante o controvariante) nelle coordinate locali. Gli argomenticonsiderati nei precedenti capitoli ci portano a pensare che lo spazio-tempo debba essere alloraconsiderato come una varieta differenziale. Le leggi fisiche andranno allora scritte in termini disezioni di fibrati associati al fibrato dei riferimenti. In questo modo le equazioni risulterannoindipendenti dalla scelta delle coordinate, ovvero trasformeranno in maniera covariante rispettoa cambiamenti di coordinate.Da questo punto di vista dunque una scelta di coordinate locali e equivalente a una scelta digauge nelle teorie di gauge. Tuttavia in questo caso la questione e un po’ piu delicata, poichenon possiamo dire a priori che solo le quantita indipendenti dalla scelta delle coordinate sonoosservabili. I fenomeni relativistici sono appunto quelli in cui i risultati delle misure dipendonodalle coordinate (cioe dal sistema di riferimento). Nella maggior parte dei casi sono propriole componenti dei tensori ad essere misurabili, sebbene dipendano ovviamente dal riferimento.Tuttavia e evidente che le quantita invarianti avranno un significato piu profondo.

12.4.2 Il principio di equivalenza e la geometria dello spazio-tempo. Il principio diequivalenza puo essere espresso nei seguenti due punti

• si consideri una particella in caduta libera (cioe muoventesi in assenza di forze differentida quella gravitazionale). Allora la sua traiettoria non dipende dalla composizione e dalla

Page 238: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 238

struttura interna della particella; (principio di equivalenza debole)

• esperimenti locali eseguiti in riferimenti in caduta libera danno risultati indipendentidalla velocita del riferimento considerato, dal’istante e dal luogo dell’universo in cui essivengono eseguiti.

Il primo punto era gia rispettato dalla teoria della gravitazione di Newton. Il secondo punto,aggiunto al primo, definisce il principio di equivalenza forte. Esso afferma che nell’intorno diogni punto si puo costruire un laboratorio abbastanza piccolo in cui gli effetti gravitazionalirisultino completamente trascurabili ed inavvertibili, almeno per tempi piccoli, per cui la fisicasara descritta (all’interno di tale laboratorio) dalla fisica dei sistemi inerziali. Nella teoria dellarelativita generale si assume usualmente che questa sia la fisica Minkowskiana. Cio non significache il campo gravitazionale non sia misurabile dato che gli osservatori potranno determinare leforze di marea, come vedremo piu avanti.Si consideri ad esempio una particella massiva in caduta libera. In un laboratorio localmenteinerziale il suo moto sara descritto, nelle fissate coordinate, dall’equazione del moto libero

d2xµ

dτ 2= 0 ,

dove τ e il tempo proprio. Questo e certamente vero in un intorno del punto xµ0 := xµ(0), ilnostro laboratorio. Questa piccola regione dello spaziotempo verra descritta con una metricaMinkowskiana ηµν . Consideriamo ora un secondo sistema di riferimento arbitrario, rispetto alquale il moto della particella sara descritto da coordinate x = x(x). Gli osservatori O di questolaboratorio vedranno allora le correlazioni spaziotemporali descritte dall’osservatore inerzialeO, in termini di una metrica gµν(x) = ηαβ

∂xα

∂xµ∂xβ

∂xν. Applicando la trasformazione di coordinate

all’equazione del moto si ottiene l’equazione che secondo O descrive il moto della particella:

d2xµ

dτ 2+ Γµαβ

dxα

dxβ

dτ= 0 ,

in cui Γµαβ sono proprio i simboli di Christoffel determinati dalla metrica gµν . Questa e l’e-quazione di una curva autoparallela su una varieta di metrica gµν dotata della connessione diLevi-Civita. Questa osservazione, unita con la terza parte del principio di equivalenza, sug-gerisce che lo spazio-tempo debba essere identificato con una varieta differenziale dotata di unametrica di segnatura Minkowskiana, in cui le equazioni che descrivono quei fenomeni local-mente non gravitazionali vengano ottenute semplicemente covariantizzando le corrispondentiequazioni note nel limite inerziale. Questo a livello pratico significherebbe sostituire la met-rica generica gµν in luogo di quella di Minkowski e la derivata covariante in luogo di quellaordinaria. In ogni dato punto si potranno sempre scegliere delle coordinate locali per le qualila matrice metrica sara proprio ηµν . Tuttavia non e vero che questo sia possibile farlo in tut-to l’intorno dato: questo dipende da quale sia realmente la metrica sullo spazio tempo. Taleeventuale impossibilita sara allora la manifestazione delle forze gravitazionali e la loro inten-sita determinera l’ampiezza della regione dello spazio-tempo in cui il limite minkowskiano saraapprossimativamente valido.

Page 239: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 239

Il principio di equivalenza puo essere indebolito, richiedendo che nel secondo punto solo gliesperimenti locali non gravitazionali eseguiti in riferimenti in caduta libera diano risultati in-dipendenti dalla velocita del riferimento considerato, dal’istante e dal luogo dell’universo incui essi vengono eseguiti. Questo viene chiamato anche principio di equivalenza di Einstein.Distinguendo gli esperimenti gravitazionali da quelli non gravitazionali tale principio in realtae piu debole ed e quindi soddisfatto da una classe piu ampia di teorie rispetto a quelle chesoddisfano il principio di equivalenza forte. In particolare la teoria della relativita generale el’unica finora nota che soddisfi il principio di equivalenza forte. Percio chiameremo il principiodi equivalenza forte principio di relativita generale.

12.4.3 Relativita generale e geometria. Quanto osservato finora richiede alcuni ulterioricommenti. Quando si covariantizza, non vi e un’unica possibilita di scegliere la derivata covari-ante. Dato il ruolo attribuito alla metrica, e chiaro che la connessione dovra essere metrica.Tuttavia questa condizione non e sufficiente a determinare univocamente la connessione, chepuo ancora dipendere dalla scelta di una torsione. L’equazione sopra determinata per il motodella particella, non e ancora sufficiente a decidere che la connessione debba essere proprioquella di Levi-Civita. Dapprima osserviamo che in questa equazione non puo esservi torsione.Si faccia infatti l’esercizio di dimostrare che se esistono delle coordinate per le quali in unpunto dato la metrica e quella di Minkowski e Γµαβ = 0 (un’arbitraria connessione metrica),allora necessariamente in quel punto la torsione e nulla. Il principio di equivalenza richiedeche questo debba valere ovunque e sempre, per cui in questa equazione si deve usare la connes-sione di Levi-Civita. Questa e una manifestazione dell’equivalenza tra massa inerziale e massagravitazionale. Non sarebbe pero strano che la torsione comparisse in altre equazioni. Questaparticolare equazione sarebbe significativa su una varieta metrica a prescindere dalla presenzao meno di una torsione. Semplicemente non sarebbe piu l’equazione di una curva autoparal-lela, continuerebbe ad essere l’equazione di una curva geodetica, che rende cioe stazionario ilfunzionale lunghezza d’arco

S[γ] = −mc∫γ

ds ,

dove ds = cdτ e il tempo proprio (e c la velocita della luce, m la massa della particella). Mentrelasciamo come esercizio la verifica di tale fatto, possiamo commentare che dunque le particellesi devono muovere di moto geodetico e questo non e affatto incompatibile con la presenza diuna eventuale torsione. L’unica condizione di compatibilita richiesta e che la connessione siametrica. Tuttavia il punto e che il principio di equivalenza deve valere per tutte le equazioniche riguardano i fenomeni localizzati. Questo significa che nel dato punto la torsione, nelledate coordinate, deve scomparire da tutte le equazioni, per cui ovunque bisogna utilizzare laconnessione metrica. Il principio di relativita generale quindi richiede che lo spazio-tempo debbaessere una varieta di Levi-Civita.Accertato questo fatto, occorre determinare delle equazioni che stabiliscano quale debba esserela metrica sullo spaziotempo che determina gli effetti gravitazionali. Queste saranno appuntole equazioni di Einstein. Vi sono diversi modi di introdurre le equazioni di Einstein. Per essere

Page 240: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 240

brevi adotteremo un approccio che, sebbene non sia necessariamente quello preferibile dal puntodi vista fisico, mette in luce gli aspetti geometrici.

Il principio di equivalenza di Einstein, come lo abbiamo scritto sopra, permette invecel’esistenza di campi diversi dal campo gravitazionale, come generatori delle interazioni gravi-tazionali. Per esempio diventa ammissibile una torsione (gravita con torsione) non nulla op-pure la presenza di ulteriori campi, oltre al campo metrico, come responsabili delle interazionigravitazionali.

12.4.4 Esercizio. Si supponga di introdurre nell’intorno di un punto O delle coordinatelocalmente inerziali, per le quali gµν(O) = ηµν e Γµνρ(O) = 0. Si dimostri che (se le coordinatedi O sono nulle) allora

gµν(x) = ηµν +1

3Rαµβν(O)xαxβ +O(|xσ|3) .

Come si vede dall’esercizio il campo gravitazionale si manifesta attraverso il tensore di Riemann.Nello stesso limite ad esempio l’equazione geodetica assume la forma

xµ +2

3Rµ

00σ(O)xσ = 0 ,

dove abbiamo ipotizzato una particella inizialmente in quiete. In particolare quindi l’osservatoreO vedra le particelle a lui molto vicine subire delle quadriforze fµ = −2

3mRµ

00σ(O)xσ, nellevarie direzioni, che interpretera come forze di marea e che potra misurare per determinare lapresenza del campo gravitazionale.

12.4.5 Il principio d’azione: equazioni di Einstein. In questa sezione accenneremo adun metodo geometrico di costruzione dell’azione di gravita, evidenziando le idee principali elasciando i dettagli come esercizio [CDF]. Poiche il ’campo di gauge’ in questo caso e la metrica,vogliamo costruire un’azione per il campo gravitazionale, che sia invariante per trasformazionigenerali, che manifesti l’invarianza locale di Lorentz e le cui equazioni del moto contenganoderivate di ordine non superiore al secondo. Nella costruzione del principio di azione vi e unpunto delicato che riguarda i termini di bordo e che va considerato con cautela nei casi in cuisi debbano considerare particolari condizioni di bordo. Qui non tratteremo tali questioni (cheescono dai nostri scopi) ipotizzando che i termini di bordo non diano mai problemi.Anzitutto, cominciamo con l’osservare che, a differenza delle teorie di Yang-Mills, non e pos-sibile a priori scegliere la varieta M che individua lo spazio-tempo. Infatti, mentre a prioriqualunque varieta ammette almeno una metrica Riemanniana, non tutte le varieta ammet-tono metrica Lorentziana. Probabilmente non e nemmeno nota una classificazione delle varietache ammettono una metrica con segnatura Minkowskiana. Questo significa che in realta leequazioni di Einstein devono determinare non solo la metrica, ma anche la varieta (o megliola classe di isomorfismo) su cui tale metrica e definita. Una possibilita e quella di costruirel’azione e le relative equazioni del moto solo localmente, ed ottenere poi le soluzioni globaliincollando le carte locali e facendo uso di qualche principio di completezza, che comunque qui

Page 241: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 241

non considereremo.Invece di procedere in questo modo, costruiamo un’azione globale in cui sia la metrica chela varieta siano incognite. Sia M una varieta, ipotetica soluzione delle equazioni di Einstein.Sappiamo che una teoria indipendente dai sistemi di riferimento puo essere costruita passandoattraverso il fibrato principale dei riferimenti R associato a TM . Possiamo allora pensare didefinire un’azione parziale iniziale su R. Ammettere che su M possa essere definita una metricalorentziana equivale ad ammettere che il fibrato dei riferimenti possa essere allora ridotto aisistemi di riferimento ortonormali (nel senso lorentziano), il fibrato che chiameremo O. Tuttele quantita costruite sul fibrato R possono essere naturalmente costruite sul fibrato O. In par-ticolare la connessione infinitesima e la forma di curvatura avranno valori in so(1, 3) (si vedail capitolo 9). Si noti che il gruppo di struttura in generale non sara ridotto a SO(1, 3) ma aO(1, 3). Si verifichi che la riduzione a SO(1, 3) puo essere fatta solamente se M e orientabile.Indichiamo sempre con θ la forma orizzontale canonica su O. Non solo e una uno-forma a valoriin R4: su R4 e definito un prodotto scalare Minkowskiano η, tale che

g(π(ξ))(π∗(X), π∗(Y )) = η(θξ(X), θξ(Y ) , ξ ∈ O , X, Y ∈ TξO .

Questa, che lasciamo verificare come esercizio, non e altro che la relazione che lega il vielbeinalla metrica.L’idea e quella di usare solo questi ingredienti per costruire un’azione su O, invariante sottol’azione del gruppo di struttura, quindi per trasformazioni di gauge, oltre che per diffeomorfismi.L’invarianza sotto l’azione del gruppo di struttura permette quindi di ridurre l’integrazione sulquoziente O/G ' M . Poiche non si hanno ulteriori strutture, l’azione deve essere costruitaintegrando delle quattro-forme su O/G, costruite a partire dalle forme su O, che sono θ, laconnessione infinitesima ω e la forma di curvature Ω. L’invarianza di gauge richiede che ladipendenza da ω possa avvenire solamente attraverso Ω. La richiesta che le equazioni del motosiano al piu del secondo ordine equivale a dire che l’azione deve dipendere al piu linearmenteda Ω. Infine l’azione deve avere la giusta parita. Per capire quest ultimo punto, osserviamo cheun possibile esempio di termine da considerare sarebbe

S1 =

∫O/G

η(θ,Ω · θ) ,

dove il punto indica l’azione di so(1, 3) su R4. Naturalmente, poiche gli argomenti del prodottoscalare sono forme a valore vettoriale e il prodotto va inteso sulla valutazione delle forme,l’integranda e una quattroforma a valori reali. Approfittiamone per specificare cosa si intendecon

∫O/G, G essendo il gruppo di struttura. Poiche assumiamo che M sia paracompatto,

ammettera un atlante al piu numerabile al quale sia associata una partizione dell’unita. Questoci permette di definire l’integrale localmente, cioe su U := π−1(U)/G, se U e un intorno locale.A questo punto, basta scegliere una qualunque sezione locale σ ∈ Γ(U,O). Detta Λ la quattro-forma invariante da integrare, allora ∫

U

Λ :=

∫U

σ∗Λ ,

Page 242: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 242

non dipende dalla scelta di σ, data l’invarianza. D’altra parte σ∗θ e il vierbein ea (in terminidella base canonica di R4). Come esercizio si verifichi che allora

S1|U ∝∫U

Rabcdεabcd√| det g|d4x .

Questo definisce la densita lagrangiana L1 tramite∫U

L1

√| det g|d4x :=

∫U

Rabcdεabcd√| det g|d4x ,

dove L1 non e realmente una funzione scalare, dato che si comporta come tale solo per trasfor-mazioni che conservano l’orientamento (lo si verifichi!). In questo senso diciamo che S1 non hala giusta parita.In conclusione dopo aver elencato tutti i possibili termini lineari in Ω, si ottiene che solo duesoddisfano i requisiti richiesti:

• il primo termine, per a ∈ R, e

Sa = a

∫O/G

θ ∧ θ ∧ θ ∧ θ ;

• il secondo termine si costruisce tramite il seguente automorfismo ε : so(1, 3) −→ so(1, 3)per il quale aab 7→ 1

2εabcda

cd. Per b reale sia allora

Sb = b

∫O/G

η(θ, ε(Ω) · θ) .

L’azione gravitazionale assume quindi la forma Sa,b = Sa + Sb.

12.4.6 Esercizio. Si dimostri che l’espressione locale dei due termini dell’azione e

Sa = κ

∫M

Λ√gd4x ,

Sb = κ

∫M

R(x)√gd4x ,

dove R e lo scalare di curvatua, κ una costante proporzionale a b e Λ una seconda costanteproporzionale ad a/b.Per concludere la nostra deduzione dell’azione gravitazionale osserviamo che se Λ 6= 0 allora lametrica di Minkowski non e ammessa in assenza di materia. Questo contrasta con il principio diequivalenza forte, almeno nella versione cosı forte in cui e enunciato. In conclusione l’azione diEinstein-Hilbert Sb e l’unica compatibile con il principio di equivalenza forte unito alla richiestadi equazioni del moto di ordine al piu quadratico.

12.4.7 Osservazione. La costante Λ e la costante cosmologica. In una teoria strettamentefedele al principio di equivalenza forte essa puo comparire come termine efficace proveniente

Page 243: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

12 TEORIA DINAMICA DELLE SIMMETRIE. 243

dall’azione che contiene i campi di materia (ad esempio le fluttuazioni di vuoto quantistico).Alternativamente potrebbe in realta accadere che il gruppo relativistico in assenza di materiasia piuttosto un gruppo di de Sitter. In tal caso si dimostra che l’azione piu generale compatibilecon tale gruppo sarebbe proprio Sa,b con a e b entrambi non nulli.

12.4.8 Osservazione. Nel costruire Sa, avremmo potuto considerare a non costante, sottoil segno di integrale. In tal caso l’unica scelta possibile sarebbe stata a = α + βρ, con α eβ costanti e ρ una funzione scalare espressa come funzione lineare della curvatura. Il terminelineare in β sarebbe allora della stessa forma di Sb, per cui non si e persa alcuna generalitanell’assumere a costante.

Page 244: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 244

13 Campi scalari e spinoriali.

Testi consigliati: [We], [N1], [N2].Nel capitolo 12 abbiamo visto come possano essere costruite le teorie di gauge nello spazio-

tempo di Minkowski. Si e anche accennato al fatto che esse si accoppiano in modo sempliceai campi di materia: basta covariantizzare le equazioni del moto tramite la connessione delcampo di gauge, che agisce sui campi tramite una data rappresentazione. In questo capitolovogliamo vedere quali siano appunto tali equazioni del moto, limitandoci ai casi interessantiper l’applicazione al modello standard delle particelle.

13.1 Le particelle e il gruppo di Poincare.

Lo studio delle rappresentazioni del gruppo di poincare e la connessione con le particelle ele-mentari richiederebbe un capitolo a se stante. Per motivi di spazio accenneremo qui solamentel’idea, rimandando gli approfondimenti a [We].

13.1.1 Algebra di Poincare. La relativita ristretta identifica lo spazio-tempo con lo spaziodi Minkowski. Come ben noto si tratta di uno spazio isotropo ed omogeneo, il cui gruppo di sim-metria (le trasformazioni isometriche) e il gruppo di Poincare P , costituito dalle trasformazionidi Lorentz, composte con le traslazioni spazio-temporali:

xµ −→ Λµνx

ν + bµ , Λ ∈ O(1, 3) , b ∈ R4 .

Un campo di materia sara caratterizzato da come si comporta sotto trasformazioni di Poincare.Se pensiamo a ψ come la funzione d’onda di una singola particella, essa individuera un elementodi uno spazio di Hilbert H, sul quale la trasformazione dovra agire unitariamente:

ψ −→ U(Λ, b)ψ .

La mappa U : P −→ U(H), essendo una rappresentazione unitaria di P su H, deve soddisfarela regola di composizione

U(Λ1, b1)U(Λ2, b2) = U(Λ1Λ2, b1 + Λ1b2) .

Il problema diventa quello di classificare le rappresentazioni di questo tipo (infinito dimension-ali!). A tale scopo conviene sfruttare la mappa esponenziale riducendosi dunque allo studiodell’algebra. Non entreremo nei dettagli, non avendo considerato gruppi di Lie infinito dimen-sionali. L’algebra di Lie di U(H) e l’algebra degli operatori antiautoaggiunti su H (non cipreoccupiamo qui delle questioni di dominio!). D’altra parte l’algebra di Poincare e generatadalle matrici aµν con aµν := ηµρa

rhoν antisimmetrica e dalle traslazioni stesse individuate dai

vettori εµ. Possiamo usare aµν , εµ come coordinate locali dell’algebra. Nell’intorno dello zeroesse diventano coordinate locali anche per il gruppo, per cui potremo scrivere

U(a, ε) = exp(i

2aµνM

µν − iεµP µ) ,

Page 245: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 245

dove Mµν = −Mνµ e P µ sono operatori hermitiani su H. In particolare nelle date coordinateavremo Λµ

ν = δµν + aµν + . . .. Applicando la regola di composizione a U(Λ, a)U(Λ, b)U(Λ, a)−1

per due arbitrarie trasformazioni infinitesime si trova allora

[Mµν ,Mρσ] = i(Mµρηνσ +Mνσηµρ −Mµσηνρ −Mνρηµσ) ,

[Mµν , P σ] = i(ηµσP ν − ηνσP µ) ,

[P µ, P ν ] = 0 .

H := P 0 e il generatore delle traslazioni temporali e puo essere identificato con l’operatorehamiltoniano. I generatori che commutano con H sono P i e J i con i = 1, 2, 3 e J1 = M2,3,J2 = M3,1 e J3 = M1,2. P i sono gli operatori di quantita di moto e J i quelli di momentoangolare. Infine Ki := M i,0 generano i boost.

13.1.2 Rappresentazioni e piccolo gruppo. Poiche gli operatori P µ commutano tra lorosi possono considerarne gli autostati (in senso generalizzato):

P µψkµ,α = kµψkµ,α ,

dove α e un indice di degenerazione. Su tali stati una pura traslazione U(1, b) agira come

U(1, b)ψkµ,α = e−ikµbµψkµ,α .

Fissata la segnatura −.+,+,+ per η, le rappresentazioni fisicamente significative sono quelleper le quali k2 := kµk

µ ≤ 0 e k0 > 0.Una trasformazione di Lorentz U(Λ, 0) agira mandando un autostato ψkµ,α in un altro autostatodi P µ con autovalore Λµ

νkν , come segue dalla regola di composizione. Quindi

[U(Λ, 0)ψ]kµ,α =∑β

L(Λ, k)αβψ(Λk)µ,β .

La trasformazione L agisce dunque sugli indici di degenerazione. Essa dovra a sua volta rappre-sentare il gruppo delle trasformazioni di Lorentz ed in realta il sottogruppo che lascia invariatokµ. Tale gruppo si chiama il piccolo gruppo. L’idea e dunuque quella di caratterizzare il camposecondo le rappresentazioni del piccolo gruppo. Rimandando i dettagli a [We], ci accontentiamodi osservare che vi sono due caratterizzazioni del piccolo gruppo che inducono rappresentazioniunitarie di interesse fisico:

• se k2 < 0 e k0 > 0, il piccolo gruppo e isomorfo al sottogruppo del gruppo di Lorentz chelascia invariato il vettore (m, 0, 0, 0). m > 0 e la massa e il piccolo gruppo e SO(3);

• se k2 = 0 e k0 := ν, si ha la rappresentazione a massa nulla e il piccolo gruppo e isomorfoal gruppo che lascia invariato il vettore (ν, ν, 0, 0). E isomorfo al gruppo ISO(2,R) dellerototraslazioni di un piano euclideo.

Prima di concludere le nostre osservazioni, aggiungiamo un ulteriore commento di tipo generalesulle rappresentazioni.

Page 246: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 246

13.1.3 Rappresentazioni proiettive e gruppo di ricoprimento. Nelle teorie quantistichegli stati sono raggi in uno spazio di Hilbert, dunque risultano definiti a meno di una fase com-plessa. Cio significa in sostanza che in luogo di rappresentazioni lineari nella fisica quantisticae piu opportuno considerare rappresentazioni proiettive. Supponiamo cioe di considerare ungruppo G del quale vogliamo una rappresentazione unitaria su uno spazio di Hilbert H. Poicheogni stato e definito a meno di una fase, anziche l’usuale regola di composizione, piu in generalepotremo richiedere che Uα : G −→ U(H) soddisfi

U(g1g2) = eiα(g1,g2)U(g1)U(g2) , g1, g2 ∈ G ,

dove α : G × G −→ R e una funzione che determina la fase. Se si impone l’associativita siottiene che la funzione di fase deve soddiafare la relazione

α(g1, g2) + α(g1g2, g3) = α(g2, g3) + α(g1, g2g3) .

Questa viene detta relazione di cociclo ed una sua soluzione si chiama un 2-cociclo chiuso. Ognirappresentazione proiettiva e caratterizzata dunque da un cociclo chiuso. Di questa equazioneesiste sempre una classe di soluzioni, dette cocicli banali o esatti e sono determinati dalle funzionif : G −→ R, secondo la relazione

α(g1, g2) = f(g1g2)− f(g1)− f(g2) ,

e si scrive α = δf . Si dicono banali perche se α = δf allora la rappresentazione proiettivapuo essere ridotta ad una lineare (cioe senza fase) tramite la mappa Uα 7→ U , dove U(g) :=eif(g)Uα(g). Se invece un cociclo chiuso non e banale, la rappresentazione e intrinsecamenteproiettiva.Si noti che la moltiplicazione per una fase e essa stessa un operatore unitario suH, che possiamoscrivere nella forma eiαI , dove I : H −→ H e l’operatore identita. Questo ci permette di direche dal punto di vista algebrico e come aggiungere all’algebra dei generatori del gruppo U(G)l’operatore I, che commuta con tutti i generatori in modo che se l’algebra originale era dellaforma

[Ja, Jb] = cabcJc ,

l’algebra estesa assumera ora la forma

[Ja, Jb] = cabcJc + cabI ,

[I, Ja] = 0 .

La nuova algebra si chiama l’ estensione centrale della vecchia. Le costanti Cab si chiamanocariche centrali. L’equivalente della condizione di cociclo a livello algebrico e l’identita di Jacobi,che in particolare implica

cadcdbc + cbdc

dca + ccdc

dab = 0 .

Questa puo essere vista come un’equazione per le costanti cab.Dato che l’algebra di partenza soddisfa di per se le identita di Jacobi, una soluzione banale edata da

cab = λdcdab

Page 247: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 247

con λd costanti (e sottintendendo la somma su d). Di nuovo questa e detta banale poiche in talcaso e sufficiente ridefinire i generatori Ja := Ja+λaI, per eliminare le cariche centrali. Diremoallora che l’estensione centrale in questo caso e banale. Vale la seguente proposizione.

13.1.4 Proposizione. Le algebre semisemplici ammettono solamente estensioni centralibanali.

Dimostrazione. Si consideri l’equazione

cadcdbc + cbdc

dca + ccdc

dab = 0 ,

di cui si supponga di aver determinato una qualunque soluzione cab. Poiche l’algebra e semisem-plice, la forma di Killing di componenti Kab = cac

dcbdc e non degenere e puo essere adoperata per

alzare ed abbassare gli indici delle costanti di struttura. Come al solito Kab indica la matriceinversa di Kab, mentra Ka

b = δab . Posto allora

cabc = KadKbfKclcdfl ,

si hacdbcc

bca = δda ,

dove si e usato anche il fatto che cabc e completamente antisimmetrico a conseguenza dellaad-invarianza. Contraendo allora l’equazione di partenza con cbce, otteniamo

cae = cbdcdcac

bce + ccdc

dabc

bce = cbd(c

dcac

bce + cdacc

cbe) = 2cbdc

dcac

bce ,

dove abbiamo ribattezzato gli indici muti (cioe quelli sommati secondo la convenzione di Ein-stein) e usato le proprieta di simmetria. A questo punto usiamo l’identita di Jacobi nellaforma

cdcacbce = −cd b

c ceca − cdcecacb

per ottenerecbdc

dcac

bce = cbd(c

dbcce

ca + cdcec

bca) ,

e, poiche45

cbdcdcec

bca = −cbdcdcacbce ,

da cui infinecae = cbdc

dbcce

ca = cae

c(cbdcbdc) = cae

cλc ,

con λc = cbdcbdc. Quindi, se esiste una soluzione, e necessariamente banale, ovvero tutte le

soluzioni sono banali. 2

13.1.5 Esercizio. Si estenda tale proposizione all’algebra di Poincare e alle rototraslazioni.

13.1.6 Ostruzioni topologiche. Ne concludiamo che nei casi che ci interessano, a livel-lo algebrico esistono solo estensioni centrali banali. Questo non basta a impedire l’esistenza

45si usi ad esempio cbd = −cdb e si ribattezzino poi opportunamente gli indici muti

Page 248: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 248

di rappresentazioni intrinsecamente proiettive, dato che le questioni algebriche sono locali eriguardano l’intorno dell’identita (o un qualunque intorno locale per traslazione). Ci possonoancora essere questioni globali, di natura topologica. Vale il seguente teorema.

13.1.7 Teorema. Sia G un gruppo di Lie finito dimensionale la cui algebra di Lie ammettasolamente estensioni centrali banali. Allora la rispettiva equazione di cociclo ammette solosoluzioni non banali se e soltanto se G non e semplicemente connesso.

Dimostrazione. Si veda [We]. 2

I gruppi ortogonali, euclidei o con segnatura, non sono semplicemente connessi, dato checontengono cammini noncontraibili. Dunque, benche semplici, ammettono rappresentazioniproiettive intrinseche, cioe rappresentazioni per le quali non si puo ridefinire la fase con unaridefinizione. Tuttavia ogni tale gruppo ammette un unico ricoprimento universale (a meno diisomorfismi), cioe un gruppo semplicemente connesso G che ammette un diffeomorfismo localee suriettivo

Φ : G −→ G .

Le rapprsentazioni di G sono quindi solamente lineari. Per i gruppi semplici Ker(Φ) e sem-pre un gruppo puntuale finito. Per i gruppi ortogonali speciali il gruppo di ricoprimento e ilgruppo di spin. In particolare SU(2) e il ricoprimento di SO(3) e SL(2,C) e il ricoprimento diSO(1, 3). In ogni caso KerΦ = Z2 =: e,−e.46 Ne segue immediatamente che ogni rappresen-tazione proiettiva di G proviene da una rappresentazione lineare di G. In particolare, dato chele uniche possibilita sono U(−e) = I oppure U(−e) = −I, e evidente che le rappresentazioniintrinsecamente proiettive sono quelle per cui U(−e) = −I. In altre parole sono proprio le rap-presentazioni di spin dei gruppi ortogonali che devono comparire nella descrizione quantisticadel mondo. Questo spiega ad esempio perche nella teoria generale del momento angolare com-pare l’intero gruppo SU(2) in luogo di SO(3). In particolare le particelle di spin semidispari (ifermioni) corrispondono alle rappresentazioni intrinsecamente proiettive di SO(3).

13.1.8 Conclusione. Tornando alle rappresentazioni del piccolo gruppo, si vede dunqueche le rappresentazioni massive, oltre che dal valore della massa m, sono individuate dallerappresentazioni spinoriali di SO(3). Possiamo dire che le particelle massive, dal punto divista delle simmetrie esterne, sono classificate dalla massa e dallo spin. Naturalmente ulteriorisottoclassificazioni possono essere indotte dalle simmetrie interne.Per quanto riguarda invece le particelle di massa nulla occorre considerare le rappresentazionidi ISO(2). Nel caso in cui si fissi kµ = (ν, 0, 0, ν) i generatori infinitesimi son J3, A :=K1 + J2 e B := K2 − J1. Di nuovo non entriamo qui nel dettaglio di come si costruisconole rappresentazioni irriducibili, ma ci accontentiamo di enunciare che quelle di interesse fisicosono classificate dall’autovalore dell’operatore J3, che rappresenta la proiezione del momentoangolare lungo la direzione spaziale della quantita di moto. Tale numero quantico si chiamaelicita. Come lo spin, e vincolata ad assumere valori seminteri, ma questa volta per motivitopologici anziche algebrici. Nuovamente rimandiamo a [We] per i dettagli.Osserviamo infine che il gruppo di Lorentz proprio SO(1, 3) non e connesso, la sua componente

46indichiamo cioe con −e il generatore di Z2

Page 249: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 249

connessa essendo il sottogruppo che preserva l’ordinamento temporale, detto gruppo di Lorentzproprio ed ortocrono.

13.2 Equazione di Klein-Gordon.

Sia M lo spazio-tempo di Minkowski d + 1 dimensionale. I campi scalari sono i campiche trasformano in maniera banale sotto trasformazioni del gruppo di Lorentz proprio edortocrono. Saranno percio sezioni di un fibrato vettoriale (E, π,M, SO(1, d), (ρ0, V )), doveρ0 : SO(1, d) −→ Aut(V ) e la rappresentazione banale SO(1, d) 7→ I, I essendo l’applicazioneidentica. In generale tuttavia su V potra agire la rappresentazione non banale di un gruppodi gauge. Nel caso di particelle libere qualunque interazione, compresa quella di gauge, deveessere trascurata. In particolare questo ci porta a richiedere che le equazioni del campo liberodebbano essere lineari.

13.2.1 Particelle scalari libere. Si noti anche che il fibrato dei riferimenti inerziali su Me in questo caso banale, cosicche, finche non intervengono le interazioni di gauge, possiamo inquesto caso considerare i campi scalari come funzioni φ : M −→ V . In fisica si parla allora diun multipletto di campi scalari di dimensione n pari alla dimensione di V . Possiamo pertantoassumere semplicemente V = R: il caso generale lo si otterra moltiplicando tensorialmente perV il campo scalare. Del gruppo di Poincare (proprio ed ortocrono) sui campi scalari solamente ilsottogruppo delle traslazioni puo agire in maniera non banale. In particolare, dato il loro ruolonella determinazione della classificazione dei campi, vogliamo ammettere che gli autostati di P µ

siano essi stessi soluzioni (in senso generalizzato) delle equazioni del moto. Ne concludiamo chel’equazione per φ deve essere determinata esclusivamente in termini di m e dell’operatore P µ.Essendo P µ il generatore delle traslazioni, esso agira sui campi scalari con la rappresentazionePµ = −i∂µ, come si puo verificare facilmente.

13.2.2 Esercizio. Si dimostri che sui campi scalari l’azione delle trasformazioni infinitesimeaµν e generata dagli operatori Mµν := xµP ν − xνP µ .

La richiesta che le autofunzioni di P µ siano soluzioni impedisce la comparsa degli operatoriMµν se si vuole che le equazioni differenziali non superino il secondo ordine. In ogni caso Mµν

non son caratterizzanti della rappresentazione, dato che non forniscono una rappresentazioneirriducibile del piccolo gruppo. Ne segue che l’unica equazione compatibile con le richieste fattee P µPµφ = −m2φ, ovvero (nelle opportune unita di misura)

(−2 +m2)φ = 0 ,

dove 2 := ηµν∂µ∂ν e l’operatore quadratello. Questa equazione e nota come equazione diKlein-Gordon.

13.2.3 Osservazione importante. Abbiamo dedotto l’equazione di Klein-Gordon comel’equazione per i campi scalari. Tuttavia supponiamo ora di considerare un campo qualunqueψα, dove l’indice interno α individua la rappresentazione non banale del gruppo di Lorentz sullospazio interno e che caratterizza il tipo di particella (scalare, spinore,. . .). Essendo naturale

Page 250: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 250

chiedere che gli stati ψkµ,α che supportano la rappresentazione costituiscano il campo, poicheP µPµψkµ,α = −m2ψkµ,α, ne segue che deve valere

(−2 +m2)ψα = 0

ovvero le singole componenti di un qualunque campo devono soddisfare l’equazione di Klein-Gordon.Tuttavia, mentre per i campi scalari questa e l’unica equazione (libera) ammessa di ordineinferiore al terzo, per i restanti campi vi saranno altre equazioni caratterizzanti.

13.2.4 Accoppiamento con il campo di gauge. Supponiamo ora di avere un multiplettodi campi scalari accoppiato con una simmetria di gauge. Cio significa che il campo avra valorein uno spazio vettoriale V , sul quale agisce un gruppo G tramite una rappresentazione nonbanale ρ. Sia dunque φ : M −→ V il campo scalare. Sappiamo che possiamo accoppiare questocampo con un campo di gauge, introducendo un fibrato principale con gruppo di struttura Gsul quale e definita la connessione che individua il campo di gauge. Se per brevita chiamiamo ρanche la rappresentazione di Lie(G) su V , indotta dalla rappresentazione ρ di G su V , allora, inun fissato gauge locale su un aperto U , avremo che il campo di gauge sara individuato da unauno-forma A a valori in ρ(Lie(G)). Scelta una base σana=1 dell’algebra, poniamo iτa := ρ(σa).Qui stiamo ammettendo che la rappresentazione sia unitaria, cosicche l’unita immaginaria rendehermitiani i generatori τa. Fissiamo inoltre una base eimi=1 di V in modo da rendere matricialela rappresentazione. Il multipletto scalare sara percio individuato da m campi scalari φi chesi accoppiano con il campo di gauge tramite la covariantizzazione ∂µ → ∂µ + iAaµτa ovverodovranno risolvere l’equazione

−ηµν(δij∂µ + iAaµτiaj)(δ

jk∂ν + iAbντ

jb k)φ

k +m2φi = 0 .

Come si vede, a causa della connessione, i vari campi φi non sono piu disaccoppiati. Essiinteragiscono tramite il campo di gauge, cioe sono carichi rispetto al campo di gauge.

13.2.5 Esercizio. Si scriva un’azione Sφ per l’equazione di Klein-Gordon accoppiata con ilcampo di gauge. Si aggiunga a questa l’azione di Yang-Mills SYM = κ

∫MTr[FµνF

µν ]d4x e siricavino le equazioni complete del moto, per A e φ.

13.2.6 Particelle scalari con potenziale. Nel caso dei campi scalare e interessante con-siderare il caso in cui il campo sia anche direttamente autointeragente. Cio significa che leequazioni del moto non saranno piu lineari neppure in assenza di campi esterni. L’azione chegenera le equazioni del moto (se ammettiamo che ammettano principio variazionale) non e piuvincolata a contenere termini quadratici nei campi. Se L0 e la densita che definisce l’azionelibera, l’azione del campo autointeragente puo essere ottenuta aggiungendo un potenziale allalagrangiana:

S[φ] =

∫M

(L0 − Φ(φ))d4x .

Naturalmente il potenziale Φ(φ) dovra essere invariante sotto l’azione del gruppo di gauge G. Sead esempio il gruppo di gauge agisce unitariamente sullo spazio V in cui il campo assume valore,

Page 251: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 251

allora V sara ovviamente dotato di un prodotto scalare (, ) : V ×V −→ C, rispetto al quale ρ(g)e unitario, se g ∈ G. In tal caso si potra considerare come potenziale Φ(φ(x)) = f((φ(x), φ(x))),dove f e un’opportuna funzione a valori reali. Un tipico esempio e f(x) = (x − v)2, per unfissato parametro v ∈ R.

13.3 Equazione di Dirac.

Vogliamo ora considerare il caso di particelle spinoriali. Naturalmente siamo interessati alcaso di uno spazio-tempo quadridimensionale, tuttavia vale la pena nuovamente prendere inconsiderazione il caso di uno spazio d + 1 dimensionale, come si e fatto per il campo scalare,giacche in teorie moderne vengono presi in considerazione spazi-tempo di dimensione maggiore.Comunque accade in generale che per campi non scalari si ha una forte dipendenza dalla di-mensione.Per esempio basti osservare che nel caso generale, per particelle massive il piccolo gruppo eSO(d), e dunque la classificazione delle particelle e individuata dalle rappresentazioni spinori-ali irriducibili di SO(d), che dipendono da d. In generale il caso a massa nulla richiederebbeun’analisi a se stante, tuttavia otterremo le equazioni a massa nulla considerando a partiredal limite per m → 0 delle equazioni massive. Per semplicita chiameremo elettrone il campospinoriale massivo. Con campo spinoriale intenderemo naturalmente la sezione di un oppor-tuno fibrato. Dedicandoci per ora al caso puramente Minkowskiano, rimandiamo piu avanti lespecificazioni relative alla struttura di tale fibrato.

13.3.1 L’elettrone e le algebre di Clifford. Vogliamo costruire il campo di spin comeuna funzione a valori in una rappresentazione del gruppo di spin associato al gruppo di LorentzSO(d, 1). Se d = 2m o d = 2m− 1, le rappresentazioni di spin possono essere costruite su C2m ,che puo infatti essere esteso ad un modulo sinistro sull’algebra di Clifford (complessificata)Cl(d, 1)⊗R C. Questo definisce un accoppiamento (pairing)

· : C(d, 1)× C2m −→ C2m , (γ, z) 7→ γ · z .

Come sappiamo l’algebra di Clifford e essenziale nella realizzazione del gruppo di spin. Ri-cordiamo che nel nostro caso lo spazio di partenza e lo spaziotempo di Minkowski M = Rd,1,provvisto della forma quadratica η. Il punto essenziale e che nell’algebra di Clifford e contenutoM come sottospazio vettoriale, cosicche il suddetto pairing induce il pairing

· : M × C2m −→ C2m .

In realta, nel caso d = 2m − 1 in cui lo spazio-tempo ha dimensione pari, come mostrato in10.2.2, l’algebra di Clifford possiede un automorfismo α che la separa negli autospazi positivoe negativo: C(η) = C(η)+ ⊕ C(η)−. Ad esso corrisponde una decomposizione dello spazio dirappresentazione S := C2m nella somma diretta S = S+⊕S− = C2m−1⊕C2m−1

, che individuanodue sottospazi per rappresentazioni irriducibili per il gruppo di spin. Tuttavia il suddettopairing, che risultera essenziale nella determinazione delle equazioni del moto, tiene in gioco

Page 252: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 252

entrambe le rappresentazioni, dato che si ha

· : M × S+ −→ S− ,

· : M × S− −→ S+ .

Il secondo punto fondamentale e la proposizione 10.2.8 riguardante l’omomorfismo ρ. Sia σ larappresentazione di spin del gruppo si Lorentz su S.47 Dati s ∈ S, x ∈M e Λ un elemento delgruppo di Lorentz, vale la proprieta notevole

σ(Λ)(x · s) = (ρ(σ(Λ))x) · (σ(s)) .

La proposizione ci dice dunque che ρ(σ) e una rappresentazione del gruppo di Lorentz su M ,cioe proprio la rappresentazione fondamentale.Consideriamo ora un campo spinoriale massivo, cioe una mappa equivariante

ψ : M −→ S ,

che trasforma cioe secondo la rappresentazione di spin σ sotto trasformazioni di Lorentz. Al-ternativamente diremo che ψ ∈ Γ(M,SM), dove SM ' M × S e detto il fibrato di spin. (siveda 13.6.2). La scelta di un sistema di coordinate inerziali su M , corrisponde ad aver definitosu TM delle sezioni eid+1

i=1 ⊂ X (M) tali che η(ei, ej) = ηij e [ei, ej] = 0.48 In particolare, se∇ e la derivata covariante di Levi-Civita, si avra ∇eiψ = ∂

∂xiψ, se xi sono le relative coordinate

inerziali. Una trasformazione di Lorentz Λ agira tramite σ su S e tramite σρ := ρ σ sullecoordinate in modo che49

σ(λ)(∂iψ) = σρ(Λ−1)i

j∂jσ(ψ) .

Ora ricordiamo che lo scopo e quello di determinare la piu semplice equazione che contenga P j edm. Nel caso del campo scalare l’unico ingrediente aggiuntivo era la metrica η, che ci costringevaa scrivere un’equazione di secondo ordine, in questo caso disponiamo di un ingrediente in piu:l’algebra di Clifford. Se γ : M → C(d, 1) e l’inclusione di Mnell’algebradi Clifford alloraponiamo γi := ei. In particolare γi · γj + γj · γi = 2ηij. Costruiamo quindi l’operatore

D : Γ(M,SM) −→ Γ(M,SM) , ψ 7→ Dψ := ηijei · ∂jψ .

L’operatore D e detto operatore di Dirac. Lasciamo come esercizio la verifica dei seguenti duepunti

• l’operatore di Dirac non dipende dalla scelta della base ortonormale;

• l’operatore di Dirac e covariante sotto trasformazioni di Lorentz su M: σ(Λ)(DΨ) =D(σ(Λ)ψ).

47dunque nel prodotto diretto di due rappresentazioni irriducibili nel caso di dimensione pari48si noti che cio e possibile poiche TM e banale49cioe xi 7→ σρ(Λ)ijx

j

Page 253: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 253

La seconda proprieta segue dalla prima e dalla suddetta proprieta notevole. In fisica si preferisceal solito usare Pi = −i∂i, cosicche si costruisce l’operatore P/ := −iD. L’equazione cercatadeve quindi avere la forma (P/ + f(m))ψ = 0. Applicando l’operatore P/ − f(m) ed usandol’osservazione 13.2.3 si ottiene che deve essere f(m) = ±m. Otteniamo finalmente l’equazionedi Dirac

(P/ −m)ψ = 0 .

13.3.2 Dimensione pari e chiralita. Consideriamo ora in particolare il caso di spazi-tempo di dimensione pari. In tal caso un campo di Dirac ψ e una sezione del fibrato SM =S+M ⊕S−M . Il campo si decompone allora nella somma diretta ψ = ψ+ +ψ−, dove ψ± e unasezione di S±M e sono dette componenti chirali del campo (positiva e negativa). Benche S± sonosottospazi irriducibili per la rappresentazione del gruppo di spin, l’equazione di Dirac mischia lediverse componenti chirali, dato che evidentemente D : Γ(M,S±M) −→ Γ(M,S∓M), mentrela moltiplicazione per la massa agisce in modo banale. In un campo massivo necessariamentecompaiono entrambe le chiralita. Le cose cambiano tuttavia per i campi di massa nulla.

13.3.3 Campi chirali: il neutrino. Nel caso di massa nulla ha senso considerare campiche siano sezioni di S+M o di S−M . Essi vengono detti campi chirali, sinistrorso e destrosrorispettivamente (left e right). Assumiamo che le loro equazioni del moto siano quelle ottenutedall’equazione di Dirac per m = 0. In questo caso esse non mischiano piu componenti left concomponenti right ed ha percio senso considerare separatamente campi left o campi right. Siparla allora di campi chirali. In senso stretto si parla di teoria chirale quando si ha a che farecon una teoria che coinvolge solamente campi di una determinata chiralita. Piu in generalepuo accadere che entrambi i tipi di campi compaiano, ma che giuochino un ruolo differente.Cosı ad esempio nella teoria elettrodebole compaiono elettroni e neutrini e le corrispondentiantiparticelle. Il campo elettronico contiene entrambe le componenti chirali del campo, mentrei neutrini sono campi chirali left, che si accoppiano (debolmente) solamente con la componenteleft dell’elettrone (si veda il capitolo successivo). A questa asimmetria tra campi left e rightcorrisponde una violazione della simmetria di parita spaziale, come accenneremo nell’ esempio13.3.8.

13.3.4 Accoppiamento con i campi di gauge. Come prima l’accoppiamento con il campodi gauge lo si ottiene introducendo una connessione sul fibrato principale in cui viene definitoil gruppo di gauge. L’azione del gruppo di gauge sul campo di spin puo avvenire direttamente tramite una rappresentazione sullo stesso spazio S, (ad esempio una simmetria U(1)) oeventualmente su una sua estensione tramite uno spazio di rappresentazione V , come nel casodel campo scalare. In tal caso potremo parlare di un multipletto di campi spinoriali. Lasciamoi dettagli come esercizio. Procedendo come in 13.2.4 si ottiene

γµ · (−iδjk∂ν + Abντjb k)ψ

k +mψj = 0 .

13.3.5 Esempio. L’elettrone in 4D. Consideriamo il caso di uno spazio-tempominkowskiano quadridimensionale. In tal caso il campo di Dirac, in un dato riferimento in-

Page 254: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 254

erziale, sara descritto da una funzione ψ : M −→ C4. Se eµ := ∂µ definisce il riferimentoortogonale e γµ = γ(eµ), l’azione di γµ su S = C4 puo essere realizzata in termini matri-ciali. Si possono cioe determinare delle matrici Γµ ∈ GL(C4) tali che ΓµΓν + ΓνΓµ = 2ηµνI e(γµ · s)α = Γµ

αβs

β, dove α = 1, . . . , 4 indica la componente in C4. Le matrici Γµ si chiamano

matrici di Dirac. Ricordiamo che esse non sono univocamente determinate, dato che su C4 sipuo agire con una trasformazione di spin. Essa corrisponde ad un cambiamento di riferimentonello spazio interno. Esiste una scelta standard di riferimento rispetto alla quale le matrici diDirac assumono la seguente forma

Γ0 =

(I OO −I

), Γ1 =

(0 σ1

−σ1 0

), Γ2 =

(O σ2

−σ2 O

), Γ3 =

(O σ3

−σ3 O

),

dove σi, i = 1, 2, 3 sono le matrici di Pauli

σ1 =

(0 11 0

), σ2 =

(0 −ii 0

), σ3 =

(1 00 −1

).

Questo riferimento e noto come rappresentazione di Dirac. La struttura a blocchi suggerisce discrivere il campo di Dirac nella forma

ψ(x) =

(ψ↑(x)ψ↓(x)

),

dove ψ↑ e ψ↓ hanno valori in C2.Vogliamo considerare il caso in cui l’elettrone si accoppi con un campo elettromagnetico. Dalpunto di vista delle teorie di gauge cio significa che c’e una simmetria U(1) locale, ψ(x) 7→eiqα(x)ψ(x). Il parametro q rappresenta la carica del campo rispetto al gruppo di gauge50.L’equazione di Dirac assume pertanto la forma

ηµνΓν(Pµ + qAµ)ψ −mψ = 0 .

Per chiarire il significato fisico e opportuno introdurre le unita di misura che mettano in evidenzai parametri fisici: la costante di Planck ~ e la velocita della luce c.51 Inoltre conviene scriverele equazioni in termini dei campi ψ↑ e ψ↓

i~∂tψ↑ = mc2ψ↑ + c

3∑i=1

σi(−i~∂i +q

cAi)ψ

↓ +q

cA0ψ

↑ ,

i~∂tψ↓ = −mc2ψ↓ + c

3∑i=1

σi(−i~∂i +q

cAi)ψ

↑ +q

cA0ψ

↓ .

Nel limite non relativistico dominano i termini in mc2 e si ha ψ↑ ≈ e−imc2t/~u±, ψ↓ ≈ eimc

2t/~u±,

dove u+ =

(10

)e u− =

(01

). Si noti che in particolare ψ↓ corrisponde a stati ad energia

50se q = 0 allora il campo trasforma banalmente per trasformazioni di gauge. In tal caso si dice che il campoeneutro

51in particolare x0 = ct

Page 255: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 255

negativa. Per interpretare fisicamente il campo di Dirac nel limite relativistico, cerchiamosoluzioni a energia positiva, imponendo la dipendenza temporale in tale limite nella formaψ↑ = e−imc

2t/~φ e ψ↓ = eimc2t/~χ. Dalla seconda equazione (trascurando i termini in ∂tχ e in

A0) si ricava allora χ in funzione di φ, che sostituito nella prima fornisce

i~∂tφ = Hφ , H =1

2m

3∑i=1

(P i +

q

cAi

)2

+q

mc

~2

3∑i=1

σiBi + qV ,

Questa e l’equazione di Schrodinger per un elettrone in un campo elettromagnetico conquadripotenziale Aµ, A0 = cV , ~B = rot ~A, se m e la massa sell’elettrone e q = −e la suacarica.

13.3.6 Esercizio. Si consideri l’equazione di Dirac per un campo massivo ψ (in 4D). Sidimostri che ρ = ψ†ψ = 〈ψ, ψ〉 (il prodotto hermitiano in C4) definisce la densita di una quantitaconservata. In particolare si verifichi che la corrente spaziale associata e ji = ψ†Γ0Γiψ.

13.3.7 Principio d’azione per il campo di Dirac. Come al solito e conveniente disporredi un principio d’azione, ad esempio per includere il campo di Dirac in teorie contenenti altricampi. L’esercizio precedente suggerisce immediatamente quale debba essere l’azione per ilcampo di Dirac: posto ψ := ψ†Γ0, si dimostri che l’azione

SD[ψ] = k

∫M

ψ(P/ −m)ψd4x ,

fornisce un principio variazionale per l’equazione di Dirac. Qui si usi P/ = Γµ∂µ. E ovviamenteimportante il fatto che nella rappresentazione di Dirac Γ0 sia hermitiana mentre Γi sono anti-hermitiane rispetto al prodotto scalare di C4. Per definire l’azione nel caso generale occorremostrare che esistono sempre delle matrici di Dirac in qualunque dimensione. Questo lo si fafacilmente per induzione. Sia d la dimensione dello spaziotempo.Consideriamo dapprima il caso d = 2m. I campi di Dirac (massivi) avranno percio valori in C2m .Supponiamo di conoscere una rappresentazione di Dirac: le matrici di Dirac, Γµ ∈ GL(C2m),µ = 0, i e i = 1, . . . , d − 1 soddisferanno Γµ,Γν = ηµν e saranno antihermitiane se i = µ,mentre Γ0 sara hermitiana.Vogliamo allora costruire le matrici di Dirac ΓN ∈ GL(C2m), N = 0, . . . , d nello spaziotempodi dimensione d+ 1 = 2m+ 1. Si verifica immediatamente che basta porre

Γµ := Γµ , µ = 0, . . . , d− 1 ,

Γd :=d−1∏µ=0

Γµ .

Viceversa, supponiamo d = 2m+1 e siano note le matrici di Dirac Γµ ∈ GL(C2m), µ = 0, . . . , d−1, con le proprieta richieste. Costruiamo allora le matrici ΓM ∈ GL(C2m+1

), M = 0, . . . , d, nel

Page 256: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 256

seguente modo

Γ0 :=

(I OO −I

),

Γi :=

(O ΓiΓi O

), i = 1, . . . , d− 1 ,

Γd :=

(O iΓ0

iΓ0 O

).

13.3.8 Esempio. Chiralita e parita. Tornando al caso d = 4, si introduca la matriceΓ5 := iΓ0Γ1Γ2Γ3. Essa e hermitiana e anticommuta con le matrici di Dirac. Inoltre si tratta diuna matrice a traccia nulla il cui quadrato e l’identita. Consideriamo la trasformazione di spinψ 7→ Γ5ψ. Ad essa corrisponde la trasformazione Γµ 7→ −Γµ = α(Γµ), dove α e l’automorfismodell’algebra di Clifford che definisce la chiralita.Si consideri ora trasformazione di inversione spaziale, che cambia segno alle coordinate spaziali,lasciando invariata quella temporale. Essa sara rappresentata da qualche operatore P si suicampi di spin, tale che PΓiP

−1 = −Γi se i = 1, 2, 3, mentre P commuta con Γ0. Ne segue chein particolare PΓ5P

−1 = −Γ5. Questo significa che l’operatore di parita scambia tra di loro glistati di chiralita opposta. Una teoria che privilegia in modo differente stati di diversa chiralitanon puo percio essere simmetrica per inversione spaziale. D’altra parte e noto che la parita eviolata in natura.

13.4 Il gruppo SO(1, 3)

Vale la pena approfondire l’analisi delle rappresentazioni di Spin del gruppo di Lorentz, comeapplicazione della teoria sviluppata nel capitolo 10.

13.4.1 Matrici Γ. Come in 13.3.5 consideriamo le seguenti 4 matrici Γ0, . . . ,Γ3 ∈M4(C):

Γ0 =

(I OO −I

), Γ1 =

(O σ1

−σ1 O

), Γ2 =

(O σ2

−σ2 O

), Γ3 =

(O σ3

−σ3 O

),

dove σi, i = 1, 2, 3 sono le matrici di Pauli

σ1 =

(0 11 0

), σ2 =

(0 −ii 0

), σ3 =

(1 00 −1

).

Si notino in particolare le proprieta seguenti:

σ1σ2 = −σ2σ1 = iσ3, σ1σ3 = −σ3σ1 = −iσ2, σ2σ3 = −σ2σ3 = iσ1,

che sono utili per mostrare che

Γ20 = I, Γ2

i = −I, (i = 1, 2, 3), ΓiΓj = −ΓjΓi (i, j = 0, 1, 2, 4).

Page 257: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 257

Ne segue che l’applicazione lineare

j : R4 −→M4(C), j((x0, . . . , x3)) = x0Γ0 + . . .+ x3Γ3

(cioe j(ei) = Γi) soddisfa:

j(x)2 = (x0Γ0 + . . .+ x3Γ3)2 = (x20 − x2

1 − x22 − x2

3)I.

La proprieta universale dell’algebra di Clifford da allora un omomorfismo di R-algebre:

J : C(1, 3) := C(Q1,3) −→M4(C) tale che J(v) = j(v)

per ogni v ∈ R4 ⊂ C(1, 3).Poiche vogliamo descrivere il gruppo di spin

Spin(1, 3) := x ∈ C(1, 3)+ : xx∗ = ±1, xV x−1 ⊂ V ,

cominciamo anzitutto a caratterizzare l’algebra di Clifford pari.

13.4.2 L’algebra di Clifford pari. L’algebra di Clifford pari C+(1, 3) ha dimensione 8 (su R)ed ha una base data da 1, eiej, e1e2e3e4 dove gli ei sono i vettori base di R4. Quindi J(C+(1, 3))e generato dalle matrici I,Γ0Γj (j = 1, 2, 3), ΓjΓk (1 ≤ j < k ≤ 3) e Γ5 := Γ0Γ1Γ2Γ3. Si ha:

Γ0Γj =

(0 σjσj 0

), ΓjΓk =

(−σjσk 0

0 −σjσk

)=

(±iσl 0

0 ±iσl

), Γ5 =

(0 −iI−iI 0

),

dove j, k, l = 1, 2, 3. La proprieta ΓiΓj = −ΓjΓi per i 6= j implica che per ogni j:

Γ5Γj = −ΓjΓ5 quindi Γ5(ΓjΓk) = (ΓjΓk)Γ5

qundi Γ5 commuta con ogni elemento dell’algebra di Clifford pari C+(1, 3). Segue che ogniautospazio di Γ5 e invariante per C+(1, 3).

Consideriamo l’applicazione C-lineare

α+,− : C2 −→ C4, α+(z1, z2) = (z1, z2,−z1,−z2), α−(z1, z2) = (z1, z2, z1, z2),

cioe, in blocchi, si ha α+(z) = (z,−z) e α−(z) = (z, z). Allora α±(C2) sono i due autospazi diΓ5 con autovalori ±i:

Γ5α−(z) = −iα−(z), perche

(0 −iI−iI 0

)(zz

)=

(−iz−iz

)e similmente Γ5α+(z) = +iα+(z). Poiche α± sono C-lineari si ha Γ5α±(z) = α±(±iz).

Come si e detto prima, questi autospazi sono invarianti per C+(1, 3). In particolare, perogni Γ ∈ J(C+(1, 3)) esiste un AΓ ∈ End(C2) = M2(C) tale che

Γα−(z) = α−(AΓz) per ogni z ∈ C2.

Page 258: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 258

Si verifica facilmente che si ha:

Γ0Γjα−(z) = α−(σjz), ΓjΓkα−(z) = α−(±iσlz).

In questo modo otteniamo un omomorfismo di algebre:

J(C(1, 3)+) −→ End(C2) = M2(C), Γ 7−→ AΓ

e si ha:AI4 = I2, AΓ0Γj = σj, AΓjΓk = ±iσl, AΓ5 = iI2.

Ora e facile vedere che questo omomorfismo e suriettivo. Poiche dimRC+(1, 3) = 23 = 8 =

dimRM2(C) si hanno allora gli isomorfismi:

C(1, 3)+ ∼=−→ J(C+(1, 3))∼=−→ M2(C), c 7−→ J(c) = Γ 7−→ AΓ.

13.4.3 Il gruppo Spin(1, 3). Da 10.2.7 si ha la definizione

Spin(1, 3) := x ∈ C(1, 3)+ : xx∗ = ±1, xV x−1 ⊂ V ,

dove, per x = x1 . . . x2k ∈ C+(1, 3) si ha x∗ = x2k . . . x1. Come appena visto in 13.4.2,C+(1, 3) ∼= J(C+(1, 3)) ⊂M4(C) e J(C+(1, 3)) ∼= M2(C).

L’antiinvoluzione ∗ : C+(1, 3)→ C+(1, 3) induce allora un’antiinvoluzione, indicata ancoracon ∗, su M2(C) nel modo seguente:

∗ : M2(C) −→M2(C), A = AJ(x) 7−→ A∗ := AJ(x∗).

Se j 6= k, si ha ΓjΓk = −ΓkΓj. Quindi

σj = AΓ0Γj 7−→ σ∗j = AΓjΓ0 = A−Γ0Γj = −σj, ±iσl = AΓjΓk 7−→ A−ΓjΓk = ∓iσl,

e si noti che

Γ∗5 = (Γ0Γ1Γ2Γ3)∗ = Γ3Γ2Γ1Γ0 = Γ0Γ1Γ2Γ3 = Γ5, quindi iI = AΓ5 7−→ AΓ∗5= iI.

Percio l’antiinvoluzione ∗ manda la base I, iI, σj, iσj (j = 1, 2, 3) di M2(C) nella baseI, iI,−σj,−iσj. Cioe, ∗ fissa le matrici diagonali e cambia il segno alle matrici con tracciazero:

X =

(a+ b cd a− b

)7−→ X∗ :=

(a− b −c−d a+ b

).

Gli elementi x ∈ C+(1, 3) con xx∗ = ±1 corrispondono alle matrici X ∈ M2(C) tale cheXX∗ = ±I, cioe:

XX∗ =

(a+ b cd a− b

)(a− b −c−d a+ b

)=

(a2 − b2 − cd 0

0 a2 − b2 − cd

)=

(1 00 1

),

Page 259: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 259

poiche detX = a2 − b2 − cd, troviamo allora

x ∈ C+(1, 3) : xx∗ = 1 ∼= SL(2,C).

Dato che SL(2,C) e connesso, la componente connessa Spin(1, 3)o di Spin(1, 3) che contienel’identita e contenuta in SL(2,C). Visto che SL(2,C) ha dimensione complessa 3 e quindidimR SL(2,C) = 6 = dimSO(1, 3) = dimSpin(1, 3), concludiamo che

Spin(1, 3)o ∼= SL(2,C),

un risultato che abbiamo gia ottenuto ‘ad hoc’ in 9.2.5 (si noti che O(1, 3) ∼= O(3, 1)).

13.4.4 Spinori di Majorana. Esiste un sottospazio reale V ⊂ C4, con dimR V = 4, tale che

J(x)v ⊂ v, ∀ x ∈ C+(1, 3), v ∈ V e t.c. C4 = V ⊕ iV ∼= V ⊗R C.

Gli elementi di V sono detti spinori di Majorana (vedi 10.4.3). Si noti che tale V non e unico:per ogni t ∈ C anche il sottospazio reale tV = tv : v ∈ V soddisfa le stesse condizioni.L’algebra reale J(C+(1, 3)) ∼= C+(1, 3) ha R-base I,Γ0Γi,ΓjΓk,Γ5 = Γ1 . . .Γ4 con i = 1, 2, 3e 1 ≤ j < k ≤ 3. Poiche ΓjΓk = −Γ0ΓjΓ0Γk, basta trovare un sottospazio reale V tale cheΓ0Γiv ∈ V per ogni v ∈ V , i = 1, 2, 3 e tale che C4 = V ⊕ iV .

Per trovare tale V osserviamo che l’azione di x ∈ C+(1, 3) su α−(C2) e data da AJ(x) (vedi13.4.2). In maniera simile, sia BJ(x) ∈M2(C) definito da

J(x)α+(z) = α+(BJ(x)z) (∀z ∈ C2); si ha Γ0Γiα+(z) = α+(−σjz)

come si verifica facilmente. Si ricordi che C4 = α+(C2)⊕α−(C2) (la decomposizione in autospaziper Γ5), e quindi si ha

Γ(α+(z) + α−(w)) = α+(BΓz) + α−(AΓw) (∀Γ ∈ J(C+(1, 3), ∀z, w ∈ C2).

Le matrici AΓ e BΓ non sono ‘indipendenti’, infatti si verifica facilmente che:

−σiS = Sσi, (i = 1, 2, 3) con S =

(0 1−1 0

)(si noti che il complesso coniugato σi di σi e σi stesso se i = 1, 3 e −σ2 se i = 2). Questo implicache −σi = SσiS

−1 e poiche (−σi, σi) = (BΓ0Γi , AΓ0Γi) otteniamo

BΓ0Γi = SAΓ0ΓiS−1.

Poiche AΓΓ′ = AΓAΓ′ per ogni Γ,Γ′ ∈ J(C+(1, 3)) e similmente per B, com’e facile verificare,otteniamo:

BΓjΓk = −BΓ0ΓjBΓ0Γk = −SAΓ0ΓjS−1SAΓ0ΓkS

−1 = −SAΓ0ΓjAΓ0ΓkS−1 = SAΓjΓkS

−1,

Page 260: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 260

e analogamente BΓ5 = SAΓ5S−1. Quindi per ogni Γ ∈ J(C+(1, 3)), cioe una combinazione

lineare con coefficienti reali di prodotti Γ0Γi, si ha

BΓS = SAΓ, ∀Γ ∈ J(C+(1, 3)).

Come gia osservato, rispetto alla decomposizione C4 = α+(C2) ⊕ α−(C2), l’azione di Γ ∈J(C+(1, 3)) e data da (BΓ, AΓ) = (SAΓS

−1, AΓ). Adesso e facile vedere che il sottospazio reale

V := α+(Sz) + α−(z) ∈ C4 : z ∈ C2= (z2,−z1,−z2, z1) + (z1, z2, z1, z2) ∈ C4 : z1, z2 ∈ C

e invariante per l’azione di J(C+(1, 3)):

Γ(α+(Sz) + α−(z)) = α+(BΓSz) + α−(AΓz)= α+(SAΓ(z)) + α−(AΓz)= α+(SAΓz)) + α−(AΓz)= α+(Sw) + α−(w) ∈ V,

dove w := AΓz ∈ C2. Una R-base di V e data dai quattro vettori

f1 = (1,−1, 1, 1), f2 = (i, i, i,−i), f3 = (1, 1,−1, 1), f4 = (−i, i, i, i)

(si noti che f1 = α+(S(1, 0)) + α−((1, 0)), f1 = α+(S(i, 0)) + α−((i, 0)) ecc.). L’azione deigeneratori Γ0Γi di J(C+(1, 3)) su questa base e data da

f1 f2 f3 f4

Γ0Γ1 f3 f4 f1 f2

Γ0Γ2 f2 −f1 −f3 −f4

Γ0Γ3 f1 f2 −f3 −f4,

e si noti che i coefficienti delle matrici di Γ0Γi rispetto a questa base sono proprio reali. E’ facilevedere che C4 = V ⊕ iV (si considerino f1 ± f3, f2 ± f4), quindi abbiamo trovato ‘gli spinori diMajorana’.

13.4.5 L’operatore di coniugazione di carica C. Alla luce di quanto appena visto, siconsideri l’operatore

C : C4 −→ C4 , α+(z) + α−(w) 7→ α+(Sw) + α−(−Sz) .

Esso e detto operatore coniugazione di carica per il motivo che vedremo in 13.4.7. E’ evidenteche se V e lo spazio reale che individua gli spinori di Majorana allora

C|V = idV

ed inoltre e antilineare e involutivo (si ricordi che S2 e l’identita). Dunque possiamo dire chegli spinori di Majorana sono gli spinori reali rispetto alla coniugazione C.

Page 261: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 261

13.4.6 Esercizio. Si dimostri cheC = −iΓ2∗ ,

dove ∗ e l’usuale coniugazione complessa in C4.

13.4.7 Esempio. Il positrone e le antiparticelle. Sia ψ la funzione d’onda di un elettrone,che quindi soddisfa l’equazione di Dirac

ηµνΓν(Pµ + qAµ)ψ −mψ = 0 .

Notando che Γ2ΓiΓ2 = −Γ∗i (il complesso coniugato della matrice Γi), posto

ψC := Cψ ,

si ottiene immediatamente che ψC e soluzione dell’equazione

ηµνΓν(Pµ − qAµ)ψC −mψC = 0 ,

cioe la stessa dell’elettrone, ma con carica opposta. La particella descritta da ψC si chiamail positrone. Tale risultato e valido per qualunque particella di spin 1

2, sia che sia carica o

meno, sia che sia massiva o meno. In ogni caso ψC descrive l’antiparticella corrispondente allaparticella descritta da ψ. Per esempio per il neutrino chirale a massa nulla, l’antineutrino hachiralita opposta.Tale proprieta, che ad ogni particella corrisponde un’antiparticella, e vera per qualunque tipodi particella, a prescindere dallo spin.52

13.4.8 Esercizio. Si consideri una particella scalare carica descritta da un campo di Klein-Gordon massivo. Si dimostri che a meno della moltiplicazione per un fattore di fase, l’operatoredi coniugazione di carica e dato semplicemente dalla coniugazione complessa.

13.4.9 La complessificazione di Lie(SO(1, 3)). La rappresentazione di SO(1, 3)o ∼=SL(2,C) su C2 induce una rappresentazione dell’algebra di Lie Lie(SO(1, 3)) su C2)

ρR : Lie(SO(1, 3)) −→ End(C2).

L’algebra di Lie Lie(SO(1, 3)) e un algebra di Lie reale (perche SO(1, 3) e un gruppo di Liereale), anche se, per ‘un miracolo’,

Lie(SO(1, 3)) ∼= Lie(SL(2,C)) ∼= M2(C)o) := X ∈M2(C) : tr(X) = 0 ,

le matrici con traccia nulla, formano gia uno spazio vettoriale complesso di dimensione tre.Per ottenere il legame con la teoria delle rappresentazioni di algebre di Lie complesse sem-

plici, dobbiamo allora considerare la complessificazione dell’algebra di Lie Lie(SO(1, 3)) che hauna rappresentazione sulla complessificazione di C2, cioe, la rappresentazione

ρ : Lie(SO(1, 3))C := Lie(SO(1, 3))⊗R C −→ End(C2)⊗R C, X ⊗ z 7−→ ρR(X)⊗ z,52Eventualmente l’antiparticella coincide con la particella, come accade ad esempio per il fotone.

Page 262: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 262

per X ∈ Lie(SO(1, 3)) e z ∈ C.Nel caso in cui uno spazio vettoriale V abbia gia una struttura di spazio vettoriale complesso,

la sua complessificazione VC := V ⊗R C ha una decomposizione canonica (cioe intrinseca), datadai due autospazi per l’azione di C su V . Quindi si considera l’aplicazione R-lineare

J : V −→ V, Jv := iv.

Gli autovalori di J sono i,−i ∈ C (si usi J2 = −I) e VC e la somma diretta degli autospazi diJ :

VC = Vi ⊕ V−i, V±i := w ∈ VC : (i⊗ 1)w = (1⊗ (±i))w .

Si noti che questa decomposizione gode della proprieta seguente: se

v 7−→ (v+, v−) ∈ Vi ⊕ V−i allora ((a+ bi)v)⊗ z 7−→ ((a+ bi)zv+, (a− bi)zv−)

per v ∈ V , a+ bi, z ∈ C con a, b ∈ R.In particolare, otteniamo

Lie(SO(1, 3)C ∼= End(C2)oC∼= End(C2)o ⊕ End(C2)o,

e, poiche Lie(SO(1, 3)C ∼= Lie(SO(4)) = so(4), questo e l’isomorfismo di algebre di Lie so(4) ∼=sl(2) × sl(2) che abbiamo gia osservato in 9.4.4. La rappresentazione ρ, che e C-lineare, e lasomma diretta delle due rappresentazioni spinoriali di so(4):

ρ : Lie(SO(1, 3))C ∼= Endo(C)⊕ Endo(C) −→ End(C2)C = End(C2)⊕ End(C2),

la C-linearita di ρR : Lie(SO(1, 3)) = End(C2)o → End(C2) garantisce infatti che ρ mandi gliautospazi della moltiplicazione con i⊗1 su End(C2)o negli autospazi corrispondenti in End(C2).

13.5 Campi di spin 1.

Benche la costruzione delle equazioni del moto per i campi di spin 1 richiederebbe un’analisiulteriore, usiamo un punto di vista semplificativo per i nostri scopi. Da 13.3.7 e l’esercizioprecedente, segue facilmente che da un campo di Dirac massivo ψ si puo ottenere un campovettoriale definendo V µ := ψΓµψ. Oltre all’equazione di Klein-Gordon esso soddisfa l’equazione∂µV

µ = 0. Assumeremo entrambe come equazioni definitorie per un campo vettoriale.

13.6 Campi e gravita (cenni).

Vogliamo ora considerare molto brevemente alcune questioni riguardanti l’accoppiamento deicampi di materia con il campo gravitazionale.

13.6.1 Esercizio. Equazioni covarianti. Si e mostrato che un modo di introdurre l’ac-coppiamento con il campo gravitazionale e quello di covariantizzare le equazioni, introducendo

Page 263: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 263

una metrica e la derivata covariante di Levi-Civita. Consideriamo ad esempio un campo diKlein-Gordon (2 +m2)φ = 0. Allora la covariantizzazione ci porta all’equazione

(gµν∇µ∂ν +m2)φ = 0 .

Tuttavia notiamo che esiste un secondo modo di scrivere l’equazione di Klein-Gordon nellospazio di Minkowski. Posto d† := −∗d∗, dove ∗ e il duale di Hodge, allora si ha (sulla 0−formaφ) 2 = 1

2(d†d + dd†). Nel caso di un manifold arbitrario con metrica gµν il duale di Hodge si

costruisce come in 1.3.7, utilizzando un vielbein. Si usi

1

2(d†d+ dd†)φ+m2φ = 0

per definire l’equazione di Klein-Gordon su uno spazio curvo. La si esprima esplicitamente intermini della derivata covariante e si confronti il risultato con l’equazione precedente.

13.6.2 Fibrati spinoriali. L’equazione di Dirac puo essere definita su varieta che ammettanola struttura di fibrato spinoriale. Per definire una tale struttura occorre poter restringereil gruppo di struttura dal gruppo lineare generale al gruppo di spin. Poiche d’altra partequest ultimo e il ricoprimento del gruppo speciale ortogonale, deve accadere anzitutto che Msia una varieta orientabile. Data una famiglia di banalizzazioni locali del fibrato tangente,come mostrato in 11.1, il fibrato sara caratterizzato da una famiglia di mappe di transizionegαβ : Uα ∩ Uβ −→ SO(p, q).53 Esse devono soddisfare ovviamente le condizioni gβα = g−1

αβ

e gαβgβγgγα = 1. Nella seconda relazione ovviamente le funzioni si intendono ristrette suUα ∩ Uβ ∩ Uγ. Il punto e che per generare un fibrato di spin bisogna poter sollevare le funzionidi struttura a funzioni a valori nel gruppo di spin, cioe γαβ : Uα∩Uβ −→ Spin(p, q), con le stessesuddette proprieta. Si fissi un sollevamento qualunque (per ogni Uα∩Uβ). Da 10.2.8 vediamo chedeve essere ργαβ = gαβ e, poiche Ker(ρ) = ±1, ne segue che γαβγβγγγα = ±1. Si dimostri che sipuo ottenere il sollevamento cercato se esiste una famiglia di funzioni σαβ : Uα∩Uβ −→ 1,−1,tale che σαβσβγσγα = γαβγβγγγα. Questa e detta condizione di cociclo e se σ esiste, si dice chela mappa w : Uα∩Uβ ∩Uγ −→ γαβγβγγγα e un cociclo banale. La banalita di w e una proprietatopologica della varieta di base M . Se M ha una tale proprieta diremo che e una varieta dispin.Sia dunque M una varieta di spin. Possiamo quindi costruire il fibrato di spin SM . Fissatolocalmente un vielbein ei ed una connessione ∇ su SM , e be definito l’operatore di DiracD : Γ(M,SM) −→ Γ(M,SM) tramite Dψ := ηijei · ∇ejψ, dove il punto indica il pairing· : TM × SM −→ SM indotto dal prodotto di Clifford, come in precedenza. In particolarese ω e la connessione infinitesima sul fibrato dei riferimenti,54 si ottiene la derivata covariantesui campi spinoriali tramite ∇µψ := (eµi ∂µ + 1

2ωµ

ijΓij)ψ, dove Γij := 12[Γi,Γj]. Segue infatti da

10.3.1 che Γij, 0 ≤ i < j ≤ d− 1 (dove d = dim(M)) sono i generatori di una rappresentazionespinoriale di so(p, q). Chiameremo questa la connessione di spin.

13.6.3 Esercizio. Su una varieta di spin M , si consideri l’equazione di Dirac costruita conla connessione di spin: (−iD − m)ψ = 0. Si ricavi l’equazione del secondo ordine ottenuta

53dove p, q individuano la segnatura54dunque una 1−forma a valori in so(p, q)

Page 264: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

13 CAMPI SCALARI E SPINORIALI. 264

moltiplicando per l’operatore −iD+m. Si discuta il risultato alla luce del precedente esercizioe delle osservazioni fatte in 13.2.3.

Page 265: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 265

14 Geometria del Modello Standard e GUT.

Testi consigliati: [CL], [CL2].Poiche una ricostruzione del modello standard delle particelle richiederebbe ovviamente

molto spazio, ci accontentiamo di un’esposizione rapida che porti direttamente ad evidenziarneil contenuto geometrico. Ovunque in questo capitolo adotteremo il formalismo dei fisici, validoin coordinate locali o in un fissato gauge, lasciando come esercizio la formulazione rigorosanei termini matematici introdotti nei capitoli precedenti. La sezione seguente e puramentedescrittiva.

14.1 I campi del modello standard.

Vediamo anzitutto quali sono i campi che intervengono nella fisica delle particelle elementari.

14.1.1 I leptoni. Vi sono due classi evidenti di particelle costituenti la materia. La primaclasse consiste di particelle elementari leggere: i leptoni. Si tratta di particelle di spin 1/2,suddivise in tre famiglie.

• La prima famiglia e costituita dall’elettrone e−, il neutrino elettronico νe e le rispettiveantiparticelle, il positrone e+ e l’antineutrino elettronico. L’elettrone e il positrone sonocarichi, mentre i rispettivi neutrini sono neutri e la loro massa e talmente piccola dapotersi considerare in prima approssimazione nulla55.

• La seconda famiglia e costituita dal muone µ−, il neutrino muonico νµ e le rispettiveantiparticelle. Mentre le cariche sono le stesse, il muone e molto piu pesante dell’elettrone.

• La terza famiglia e costituita dal tauone τ−, il neutrino tauonico ντ e le rispettiveantiparticelle. Il tauone e il piu pesante dei leptoni.

Le particelle cariche ovviamente interagiscono elettromagneticamente. Tutti i leptoni comunqueinteragiscono anche in un secondo modo, cioe mediante interazione debole. Essa e responsabilead esempio del decadimento del muone che si trasforma in elettrone emettendo un neutrinomuonico ed un antineutrino elettronico. L’interazione debole vede in effetti ogni neutrino conil corrispondente leptone carico, come le due componenti di un doppietto isotopico, sul qualeagisce una simmetria SU(2). Alcuni esperimenti mostrano inoltre che l’interazione deboleviola la parita spaziale. In effetti si trova che tali esperimenti sono ben descritti dalla teoriase si assume che i neutrini siano chirali con chiralita left. Essi interagiscono solamente con lecomponenti left dei leptoni carichi negativamente. Le componenti right di questi ultimi sarannodunque descritte da singoletti di SU(2).56

14.1.2 Gli adroni e l’ottuplice via. Gli adroni costituiscono una vastissima collezione diparticelle che si suddividono in due principali famiglie: i mesoni e i barioni. Tutte queste parti-celle sono composte e interagiscono sia elettromagneticamente, sia debolmente e sia fortemente.

55la questione sulla massa dei neutrini non verra qui considerata e in ogni caso assumiamo che sia trascurabile56per le antiparticelle i termini left e right vanno interscambiati

Page 266: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 266

L’interazione forte e responsabile ad esempio dell’attrazione tra nucleoni o di decadimenti moltoveloci (con tempi di decadimento dell’ordine di 10−23 secondi). I mesoni sono particelle con spinintero, dunque bosoni, e quelli instabili possono decadere lasciando solamente leptoni o fotonicome prodotti di decadimento. I barioni, che comprendono protoni e neutroni, sono inveceparticelle di spin semidispari, dunque fermioni, e quelli instabili decadono lasciando comunquebarioni come prodotti di reazione.Come si e detto gli adroni non sono particelle elementari, ma sono composte. I mattoni cos-tituenti sono i quark, che sono particelle di spin 1/2 e carica frazionaria. I mesoni sono costituitiad esempio da coppie di quark ed antiquark, mentre i barioni sono costituiti da un numero datre quarks (o tre antiquarks). Consistentemente ad ogni quark si associa numero barionico 1/3(con il segno meno per gli antiquarks). Il decadimento del neutrone, che si trasforma in unprotone emettendo un elettrone ed un antineutrino elettronico, oltre a mostrare che i quarkcome i leptoni possono interagire anche debolmente, suggerisce appunto che i quark compaianoin doppietti isotopici, proprio perche se non differissero per la carica, neutrone e protone com-paiono in maniera simmetrica nelle interazioni nucleari. Originariamente si pensava dunque adue quarks: l’up e il down costituenti il doppietto(

ud

).

Poiche a neutrone e protone si associava spin isotopico 1/2, con terza componente +1/2 peril protone e −1/2 per il neutrone, si faceva l’identificazione p = uud e n = ddu. Le caricheelettriche dei quark devono essere dunque 2/3 per u e −1/3 per d. Oggi si sa che i quark, comei leptoni, sono suddivisi in tre famiglie (con i corrispondenti antiquarks)57, di masse via viacrescenti:

• i quarks up (u) e down (d) con terza componente dello spin isotopico T3 = 12,−1

2

rispettivamente e cariche q = 23

e q = −13;

• il quark charm (c al quale e associato il numero quantico di incanto c = 1) con T3 = 12,

q = 23

e il quark strange (s avente stranezza s = 1) con T3 = −12, q = −1

3;

• il quark top (t al quale e associato il numero quantico t = 1) con T3 = 12, q = 2

3e il quark

beauty (o bottom) (b avente bellezza b = 1) con T3 = −12, q = −1

3.

Come prima, i doppietti riguardano le componenti left responsabili delle interazioni deboli,mentre le componenti right sono disposte in singoletti. E comunque interessante osservareche, dato che i quarks c, b, t sono molto pesanti, furono scoperte dapprima quelle particellecostituite dai quark up, down e strange. In particolare vi erano alcuni decadimenti che dovevanoessere attribuiti a interazioni forti (dato che non coinvolgevano ne fotoni ne neutrini), maciononostante avvenivano in tempi molto piu lunghi di quelli tipici delle interazioni forti. Leparticelle che decadono in questo modo vennero percio battezzate strane e il fenomeno fuattribuito alla tendenza a conservare un nuovo tipo di numero quantico, detto appunto lastranezza.

57piu precisamente la quantizzazione risulta consistente solamente se il numero di famiglie di quarks e ugualeal numero di famiglie leptoniche

Page 267: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 267

cccc

ccccc

ccccc

cc

cccc

cc

α1

α2

ss

s

u d

s

Y

T3

TTTTTTT

Q = 1/3Q = −2/3

cccc

ccccc

ccccc

cc

cccc

cc

ss

ss

ud

Y

T3

TTTTTTT

α1

α2Q = −1/3 Q = 2/3

Ottetto dei Barioni

cccc

ccccc

ccccc

cc

cccc

cc

ss ss s

s

s

s

s

Σ+ (uus)

p (uud)n (ddu)

Σ− (dds)

Ξ− (dss) Ξ0 (uss)

Σ0 Λ0

TTTTTTT

TTTTTTT

Y

T3

Q = −1 Q = 0 Q = 1

Ottetto dei Mesoni

cccc

ccccc

ccccc

cc

cccc

cc

ss ss s

s

s

s

s

TTTTTTT

TTTTTTT

π+ (ud)

K+ (us)K0 (ds)

π− (du)

K− (su) K0 (sd)

η π0

Y

T3

Q = −1 Q = 0 Q = 1

Decupletto dei Barioni

cccc

ccccc

ccccc

ccc

cccc

cc

s ss s

s

s

s

s

ss

s

TTTTTTTTTTTTTTTTTTTTT

∆++ (uuu)∆− (ddd)

Ω− (sss)

Σ∗+ (uus)

∆+ (uud)∆0 (ddu)

Σ∗− (dds)

Ξ∗− (dss) Ξ∗0 (uss)

Σ∗0 (dus)

YQ = −1 Q = 0 Q = 1 Q = 2

T3

Page 268: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 268

Le particelle potevano quindi essere classificate riunendole in schemi, secondo la loro stranez-za (disposta in maniera crescente dal basso verso l’alto) e alla loro carica (crescente nella di-rezione obliqua SO-NE), come mostrato nella pagina precedente. Gli ottetti e il decupletto ineffetti ricordavano i pesi delle rappresentazioni irriducibili di su(3) mentre gli schemi associatialle rappresentazioni fondamentali non comparivano. Nonostante cio, era naturale ipotizzarel’esistenza di tre particelle (e le loro antiparticelle) corrispondenti a tali rappresentazioni, e chedovessero costituire i mattoni fondamentali della materia. Essi furono chiamati quark.58 Il fattoche tuttora non si riescano a vedere i quark liberi, cioe non in stati legati come nei multipletti,e attribuito ad un meccanismo che impedisce ai quarks di muoversi liberamente, almeno alleenergie finora disponibili: il meccanismo del confinamento. In particolare si noti che tutti glistati legati che compaiono, hanno carica elettrica intera. Il meccanismo del confinamento e unmistero che a tuttoggi attende una spiegazione soddisfacente. La ricerca di stati con caricafrazionaria, o dei quark isolati ha comunque fino ad ora dato esito negativo.Se assumiamo che i quark up, down e strange siano i tre stati della rappresentazione fonda-mentale e gli antiquark quelli della coniugata, allora lo schema dei mesoni rientra in modonaturale nella rappresentazione 3 ⊗ 3∗ = 8 ⊕ 1, mentre gli schemi dei barioni sono individuatidalla rappresentazione 3⊗ 3⊗ 3 = 10⊕ 8⊕ 8⊕ 1. Questa simmetria SU(3), viene detta sim-metria di sapore59. Tale simmetria non e esatta, cosa che si manifesta nel fatto che le massedei quark (e delle particelle nei multipletti) sono diverse. La scoperta degli altri quark portainoltre ad allargare la simmetria dei sapori a SU(6), con schemi molto complicati, ma moltomeno evidenti, a causa delle notevoli differenze di massa dei rimanenti quark. Il punto inter-essante nell’individuazione di tali schemi non e comunque nell’aver individuato il manifestarsidi una simmetria (non esatta) di sapore. Si consideri il decupletto dei barioni. Inizialmenteesso non era completo, poiche mancava in realta uno dei vertici (le particelle Ω). Cio non erasorprendente, poiche avendo i quark spin 1

2la funzione d’onda che descrive lo stato composto

da tre quark deve essere antisimmetrica nello scambio qualunque di due di essi. Nel caso delleparticelle ai vertici del diagramma, in cui i quark hanno esattamente gli stessi numeri quantici,sarebbero dunque permessi solamente stati con configurazioni spaziali di momento angolaresuperiore, difficili da realizzare (tenendo conto anche dell’elevata massa delle particelle). Tut-tavia quando la particella Ω fu scoperta, venne prodotta nello stato fondamentale con momentoangolare nullo.

14.1.3 I quark e i colori. Sia ψs(α;x) la funzione d’onda a valori complessi che descriveun quark strange con numeri quantici α. Se i numeri quantici sono la carica, lo spin il saporee lo spin isotopico, poiche lo spin ha solamente due valori mentre i restanti numeri quanticisono completamente fissati, e impossibile costruire, dal prodotto tensore di tre di tali funzioni,una funzione d’onda a tre particelle completamente antisimmetrica nello scambio dei quark,con tutti e tre i quark nello stato corrispondente a momento angolare nullo. Lo stato a energiapiu bassa dovrebbe corrispondere al momento angolare ~ (con due quark di momento nulloe uno di momento ~). L’analisi dello spettro di energia degli stati eccitati della particella Ω

58Suggerito da Gell-Mann, ispirandosi a una frase del romanzo ‘Finnegans wake’ di J.A.A. Joyce. Quark intedesco e in inglese significa ‘ricotta’.

59i numeri quantici u, d, s, c, b e t vengono infatti detti sapori

Page 269: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 269

evidenzia invece che lo stato a energia piu bassa ha momento angolare nullo e deve dunquecorrispondere al caso in cui tutti e tre i quark hanno momento nullo. Cio e vietato dal principiodi esclusione di Pauli, a meno che non esista un nuovo numero quantico che per ogni quarkpossa assumere tre distinti valori. Tale numero quantico viene detto colore e i tre possibilivalori vengono indicati con rosso, blu e verde per i quark e antirosso, antiblu e antiverde per gliantiquark. Sullo spazio dei colori agisce il gruppo di simmetria SU(3)C (cioe SU(3) di colore)ritenuto responsabile delle interazioni forti. A differenza delle simmetrie di sapore, si ritieneche la simmetria di colore sia esatta.

14.1.4 I campi di gauge. Assumendo che le interazioni tra le particelle siano mediate dadei campi di gauge, tramite la manifestazione di simmetrie locali come descritto nei precedenticapitoli, si puo pensare che mentre l’interazione elettromagnetica e associata ad un gruppo digauge U(1), le interazioni debole e forte siano associate ai gruppi SU(2)L e SU(3)C . Il gruppodi gauge del modello standard e identificato con

GMS = U(1)Y ⊗ SU(2)L ⊗ SU(3)C .

Il gruppo di gauge U(1)Y viene detto gruppo di ipercarica e non coincide con il gruppo U(1)emresponsabile dell’interazione elettromagnetica. La carica associata ad U(1)Y viene detta iper-carica. Poiche U(1)Y commuta co SU(2)L, le componenti di un fissato doppietto di SU(2)Ldevono avere la stessa ipercarica, cosa che non avviene invece per la carica elettrica. Ad esem-pio neutrino elettronico ed elettrone devono avere la stessa ipercarica ma l’elettrone e caricomentre il neutrino no. D’altra parte se si assume che T1, T2, T3 siano i tre generatori infinitesimidi SU(2)L e che T3 sia diagonale, allora per ogni doppietto leptonico o dei quark, cosı comeper i singoletti, si ottiene che q − t3 (t3 essendo l’autovalore di T3) e costante e puo essereidentificato con l’ipercarica a meno di una costante moltiplicativa. e convenzionale scegliere lanormalizzazione in modo tale che Q = T3 + Y

2.

Il gruppo U(1)em e quindi una combinazione dei gruppi U(1)Y e del sottogruppo U(1) di SU(2)generato da T3. Al gruppo U(1)Y si associa un campo di gauge abeliano AY , come nell’elettro-magnetismo. Al gruppo SU(2)L invece corrisponde un campo di gauge a valori in su(2) ovverotre campi di gauge: AL = A+

LT+ +A−LT−+A3LT3, di cui A±L individuano due campi di gauge che

risultano essere carichi elettricamente (W±), mentre A3L si combina con AY per dare origine al

campo di gauge elettromagnetico Aem ed un altro campo neutro (Z0). Aem rappresenta i fotoni,mentre gli altri campi vengono anche detti luce pesante. Infine il gruppo SU(3)C definisce 8campi di gauge colorati AC = AαCλα, dove λα sono i generatori della rappresentazione aggiuntadi SU(3). Questi campi, che trasportano carica frazionaria e carica di colore si chiamano igluoni.

14.1.5 Il bosone di Higgs. Oltre ai campi finora discussi nel modello standard compareun campo scalare complesso: il bosone di Higgs. Il punto e che, come abbiamo visto, la teoriaelettrodebole e basata su una simmetria chirale, e pertanto richiede l’annullarsi delle massein gioco. E un fatto sperimentale evidente che invece solamente il fotone e (forse) i neutrinihanno massa nulla. Cio significa che la simmetria debole deve essere rotta in qualche modo.Poiche la massa di un campo compare nella lagrangiana tramite un termine quadratico nel

Page 270: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 270

campo, si potrebbero aggiungere tali termini a mano. Questo metodo esplicito di rompere lasimmetria fin dall’inizio e pero troppo brutale e rende piu difficoltosa la quantizzazione dellateoria. Un metodo piu sottile consiste invece nell’aggiungere un campo scalare opportunamenteaccoppiato con gli altri campi e descritto da un potenziale che rispetta tutte le simmetrie delmodello. Il trucco sta nel scegliere un potenziale per il quale le configurazioni di minimaenergia non rispettino la simmetria, cosicche per una fissata soluzione delle equazioni del motola simmetria si rompe e vengono generati i termini di massa. Questo e detto meccanismo diHiggs e si parla allora di rottura spontanea della simmetria. Del bosone di Higgs non vi e tuttoraalcuna evidenza sperimentale.

14.2 Costruzione del Modello Standard.

Una volta stabiliti gli ingredienti principali del modello standard, si puo procedere nella suacostruzione.

14.2.1 Il modello elettrodebole. Consideriamo per prima la parte di interazione elet-trodebole. A tale scopo trascureremo momentaneamente l’interazione forte che verra aggiuntasuccessivamente covariantizzando rispetto al gruppo SU(3)C .I campi di gauge.Il gruppo di gauge elettrodebole e U(1)Y ×SU(2)L. Il campo di gauge U(1)Y e AY µ con campodi forze FY µν = ∂µAY ν − ∂νAY µ. Per SU(2)L avremo invece tre campi Aiµ, i = 1, 2, 3 con campidi forze F i

µν = ∂µAiν − ∂νAiµ + g

∑j,k ε

ijkAjµAkν , dove g e la costante di accoppiamento. L’azione

di Yang-Mills elettrodebole e quindi

SedYM = −1

4

∫[FY µνF

µνY +

∑i

F iµνF

iµν ]d4x .

I campi di materia.Consideriamo una famiglia di campi di materia. Essa consiste di:

• un doppietto di isospin contenente quark left,

ψL : M −→ C2 ⊗ C4

dove M e lo spazio-tempo di Minkowski, il fattore C2 e lo spazio di supporto per larappresentazione fondamentale di SU(2) e C4 lo e per la rappresentazione spinoriale delgruppo di spin di SO(1, 3). Tipicamente si scrive

ψL =

(ULDL

)dove UL e DL hanno valori in C4. A tali campi si associa ipercarica Y = 1

3. La notazione

adottata e la seguente: se ψU e la funzione d’onda (di Dirac) per il quark di tipo up (adesempio u), allora

UL =1− Γ5

2ψU , UR =

1 + Γ5

2ψU ,

Page 271: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 271

e cosı via. Alternativamente scriveremo ad esempio

ψL =1− Γ5

2ψ ,

dove ψ ha valori in C2 ⊗ C4 e le matrici gamma agiscono come l’identita su C2;

• un doppietto di isospin con i leploni left,(V`L`−L

)di ipercarica Y = −1;

• un singoletto con il quark UR di ipercarica Y = 43

e chiralita negativa;

• un singoletto con il quark DR di ipercarica Y = −23

e chiralita negativa;

• un singoletto con il leptone `−R di ipercarica Y = −2 e chiralita negativa.

Rammentando che ogni quark ha tre stati di colore, si tratta in tutto di 15 stati chirali, ai qualisi aggiungono i quindici stati di antiparticella. Utilizzando il metodo di covariantizzazioneillustrato ad esempio nel capitolo 13 e semplice costruire la lagrangiana relativa ai campi dimateria. Per ottenere una scrittura compatta introduciamo le notazioni seguenti

ψQ :=

(ψU

ψD

), ψe :=

(ψV

ψ`

)in modo che ad esempio

1− Γ5

2ψQ =

(ULDL

),

1 + Γ5

2ψe =

(0`−R

),

eψQ = (ψU , ψD) .

Indichiamo con Y l’operatore di ipercarica e con τi, i = 1, 2, 3 gli operatori di isospin. Essiagiranno come lo zero sui singoletti e come τi = 1

2σi sui doppietti, σi essendo le matrici di

Pauli. Le matrici di Pauli agiscono come l’identita sul fattore C4, mentre agiscono in manieranon banale su C2. Ad esempio

Y ψe =

(−ψV

−ψ` − `−R

)e

τiψQ =

1

2σi

1− Γ5

2ψQ .

In altre parole le matrici Γ agiscono sulle singole componenti del doppietto, mentre le matricidi Pauli agiscono sull’indice di doppietto, cioe ad esempio

Γµ

(ψU

ψD

)=

(Γµψ

U

ΓµψD

), σ1

(ψU

ψD

)=

(ψD

ψU

).

Page 272: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 272

Cio significa semplicemente che ψQ ha valore nello spazio di supporto delle rappresentazioneprodotto ρSU(2) ⊗ ρSpin(1,3), ρSU(2) essendo la rappresentazione fondamentale. Con questenotazioni l’azione per il modello elettrodebole e

Sedmat =

∫(iψQΓµDµΨQ + iψeΓµDµΨe) ,

dove

Dµ =

(∂µ − i

ged2Aiµσi

1− Γ5

2− igY

Y

2AY µ

).

Il meccanismo di Higgs.Nell’azione finora costruita la chiralita dell’interazione debole ha forzato a considerare sola-mente campi di massa nulla. Vediamo molto brevemente come si possa generare una massaaccoppiando il sistema con un campo scalare. Si consideri un campo scalare complesso costituitoda un doppietto di isospin con ipercarica Y = 1

H : M −→ C2 , H =

(H+

H0

).

Diciamo che H e un doppietto scalare, poiche il gruppo di Lorentz agisce banalmente su diesso. In altre parole H assume valori in C2 ≡ C2 ⊗ C0, supporto per la rappresentazioneρSU(2) ⊗ 1SO(1,3). Assumiamo dunque per tale campo l’azione di Klein-Gordon covariantizzata

SH =

∫[(DµH)†DµH − V (H)]d4x ,

con derivata covariante

DµH =

(∂µ − i

ged2Aiµσi − igY

1

2AY µ

)H

e potenziale a fondo di bottiglia

V (H) = −1

2m2HH

†H +1

2λH(H†H)2 .

Posto come d’uso v := mH/√λH ∈ R, tale potenziale ha minimo per |H| = v/

√2. A meno di

una trasformazione di gauge globale U(1)Y × SU(2)L, sullo stato di vuoto il campo assumeradunque valore di aspettazione

〈H〉 =

(0v√2

)∈ C2 .

Le fluttuazioni attorno a tale configurazione di vuoto si possono parametrizzare nella forma

H(x) = eiξiτi

(0

v+η(x)√2

),

Page 273: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 273

dove η e ξ sono campi con valore di aspettazione nullo sul vuoto. La fase ξa puo essere eliminatacon una trasformazione di gauge locale SU(2)L, sotto la quale trasformeranno anche i campileft e il campo di gauge A, mentre resteranno invariati i campi right e AY . Prima di farlo siconsideri l’interazione tra il campo scalare e quelli di materia

Smassa =

∫ [κeψ

eLH`

−R + ψQL

(κDHDR +

i

2κUσ2H

∗UR

)]d4x+ h.c. ,

dove h.c. significa hermitiano coniugato.

14.2.2 Esercizio. Si esegua la suddetta trasformazione di gauge e si dimostri che

1. nell’azione Smassa compaiono i termini di massa per i campi `−, U e D, con masse

m` =κ`v√

2, mU =

κUv√2, mD =

κDv√2

;

2. in SH rimane il campo dinamico η con massa mH (il campo di Higgs fisico);

3. se Aiµ e il campo elettrodebole trasformato, allora in SH compaiono dei termini di massaper i campi di gauge nella forma∫ (

g2edv

2

4W+µ W

−µ +g2edv

2 + g2Y v

2

8Z0µZ

)d4x ,

dove

W± :=A1µ ± iA2

µ√2

sono campi di massa mW = gedv2

, mentre

Z0µ = cos θW A

3µ − sin θWAY µ ,

Aµ = sin θW A3µ + cos θWAY µ ,

in cui θW e detto angolo di Weinberg e soddisfa tan θW = gYged

, cosicche Aµ ha ancora

massa nulla mentre Z0µ ha massa mZ = mW/ cos θW ;

4. mentre la simmetria SU(2)L e rotta, si verifichi che sopravvive ancora una simmetriaU(1)em generata da τ3 + Y

2, sotto cui Aµ trasforma come campo di gauge e W±

µ hannocarica ±1 mentre Z0

µ e Aµ sono scarichi. Dunque Aµ puo essere identificato con il campoelettromagnetico. I restanti campi di gauge diventano massivi e sono anche chiamati lucepesante;

5. in particolare si verifichi che i campi neutri si accoppiano alle correnti attraverso i termini

ejemµAµ +

g

cos θWj0µZ

0µ ,

dove sin2 θW jewµ = j3µ − j0

µ e e = g sin θW ;

Page 274: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 274

6. si verifichi che la condizione Y = 1 per il campo di Higgs (cioe una delle componenti hacarica nulla) e necessaria a garantire la sopravvivenza di un gruppo non rotto U(1)em.

Il meccanismo di Higgs dunque realizza la rottura di simmetria

U(1)Y × SU(2)L −→ U(1)em .

Le particelle W± e Z0 sono in effetti state rilevate al CERN, mentre manca tuttora evidenzadell’esistenza del bosone di Higgs, che confermi la realta del meccanismo di Higgs.

14.2.3 L’angolo di Cabibbo e la matrice di Kobaiashi-Maskawa. Il punto e che non c’eun’unica famiglia di leptoni, ma ne sono note tre. Se alle funzioni d’onda assegnamo un indicedi famiglia ψa, a = 1, 2, 3 per le famiglie contenenti l’elettrone, il muone e il tauone, mentrel’azione per i campi fermionici sara la somma delle azioni delle singole particelle, l’interazionetra il campo di Higgs e le famiglie potra avvenire attraverso matrici κA,ab dove A = e, U,D.Utilizzando questo nell’azione Smassa si ottiene allora che i termini di massa potranno essererappresentati da matrici

MA,ab =v√2κA,ab ,

che in generale non saranno diagonali. In altre parole gli autostati di gauge non coincidono congli autostati di massa. Se le matrici di massa fossero hermitiane, le si potrebbe diagonalizzarecon una rotazione unitaria. Si potrebbe cioe scrivere

MA = U †AMAUA ,

con MA diagonale e UA unitaria. Tuttavia tali matrici non sono necessariamente unitariecosicche per diagonalizzarle non basta una sola matrice UA (per ogni A), ma e necessarioutilizzare una coppia di matrici unitarie XA,ab e VA,ab (definite a meno di matrici diagonaliunitarie), in modo che

MA = X†AMAVA ,

essendo MA matrici diagonali. I termini di massa per i fermioni assumono percio la forma

ψL,aMabψR,b = ¯ψL,aMabψR,b ,

dove abbiamo omesso l’indice di famiglia per semplicita e introdotto gli autostati di massa

ψL = X†ψL , ψR = V †ψR .

14.2.4 Esercizio. Si considerino tali trasformazioni nell’azione SD. Si dimostri che

• i bosoni carichi W± si accoppiano alle correnti cariche

j±µ =¯ψA

LUABψBL ± h.c.

2i12∓ 1

2

,

dove A e B assumono i possibili calori A = U e B = D oppure A = B = `, mentreUAB = XAV

†B e come al solito h.c. indica l’hermitiano coniugato dell’espressione ad esso

precedente; le matrici UAB si dicono matrici di mixing;

Page 275: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 275

• si verifichi che se i neutrini hanno massa nulla, la matrice di mixing leptonico U`` eininfluente; si verifichi che le interazioni neutre, definite dai termini contenenti Z0

µ o ilfotone, non contengono la matrice di mixing.

Da questo esercizio segue che anzitutto i leptoni non risentono del mixing delle famiglie. Perquanto riguarda i quark cio e vero solamente per le correnti neutre, che in termini degli autostatidi massa si ottengono da quelle di partenza sostituendo ψ a ψ. L’unica matrice di mixing influ-ente e dunque UKM := UUD, nota come matrice di Kobaiashi-Maskawa. Nelle interazioni checoinvolgono i bosoni W±, dette appunto interazioni cariche, i quark si mischiano comparendonell’azione del modello standard attraverso le funzioni d’onda(

ψuLψd′L

),

(ψcLψs′L

),

(ψtLψb′L

),

dove ψd′Lψs′Lψb′L

:= UKM

ψdLψsLψbL

.

Poiche le particelle sono identificate dagli autostati di massa, sono le funzioni ψ quelle chedescrivono gli stati associati alle singole particelle. Dunque, mentre le interazioni neutre con-servano i sapori delle famiglie, le interazioni deboli cariche cariche mischiano le famiglie. In unprima approssimazione si ha

UKM ∼

cos θc sin θc 0− sin θc cos θc 0

0 0 1

,

dove θc e detto angolo di Cabibbo. Cio significa che ad esempio uno stato ψu puo decaderedebolmente, tramite un’interazione carica, in uno stato cos θcψ

d + sin θcψs, dando origine a

interazioni che per una frazione sin2 θc violano la stranezza. Queste violazioni furono quelleche portarono Cabibbo a introdurre il suo famoso angolo, in un momento in cui in realta essonon aveva alcuna interpretazione ovvia, dato che ancora non vi era neppure alcuna ipotesisull’esistenza dei quark c, b, t.

14.2.5 Nota. I valori sperimentali degli angoli di Weinberg e di Cabibbo sono sin θW ≈ 0.23120e sin θc ≈ 0.225, tuttavia tale vicinanza dei valori e del tutto accidentale. Infine osserviamosenza ulteriori analisi che l’ambiguita di fase nelle matrici di rotazione e collegata al fenomenodella violazione di CP , cioe della rottura della simmetria di parita e coniugazione di carica.

14.2.6 La cromodinamica (cenni). Per completare il modello standard ci rimane daconsiderara l’interazione di gauge SU(3)C . Tale interazione di gauge viene descritta dallaconnessione di colore ACµ = 1

2AaCµλa dove λa, a = 1, . . . , 8 sono le matrici di Gell-Mann

λ1 =

0 1 01 0 00 0 0

, λ2 =

0 −i 0i 0 00 0 0

, λ3 =

1 0 00 −1 00 0 0

,

Page 276: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 276

λ4 =

0 0 10 0 01 0 0

, λ5 =

0 0 −i0 0 0i 0 0

, λ6 =

0 0 00 0 10 1 0

,

λ7 =

0 0 00 0 −i0 i 0

, λ8 =1√3

1 0 00 1 00 0 −2

.

Si noti che λ3 e λ8 generano la sottoalgebra di Cartan. Gli 8 campi AaCµ, a = 1, . . . , 8 sonoi campi di gluoni e hanno sia cariche di colore che cariche elettriche frazionarie. Poiche finoad ora tale tipo di cariche non e stato visto, i gluoni come i quark compaiono solo in statifortemente legati ed e ragionevole ritenere che l’interazione forte debba essere responsabiledel confinamento. L’azione della cromodinamica si ottiene dunque aggiungendo il termine diYang-Mills ottenuto con i campi di forze gluonici FCµν := ∂µACν − ∂νACµ − igF [ACµ, ACν ]

ScromYM = −1

2

∫Tr[FCµνF

µνC ]d4x ,

e covariantizzando, rispetto alla connessione gluonica, le derivate parziali che agiscono sui quark:

∂µψQ 7−→ (∂µ − igFACµ)ψQ .

Non ci occuperemo di analizzare oltre gli aspetti della cromodinamica.

14.2.7 Esercizio. Si scriva l’azione completa per il modello standard.

14.3 La massa dei neutrini.

Mentre nel modello standard si assume che la massa dei neutrini sia nulla, e piuttosto recentela conferma del fatto che in realta tra le famiglie di neutrini ci siano delle differenze di massa.Se infatti i diversi neutrini avessero masse diverse, similmente a quanto avviene per esempionel caso dei quark vi sarebbe la possibilita che gli autostati di massa e quelli di sapore fosserodifferenti. In altre parole i termini quadratici che determinano le masse dei neutrini nell’azionepossono in generale avere la forma

Lmassa =∑ij

νiMijνj ,

dove la matrice dei coefficienti non e diagonale e i, j assumono i valori simbolici e, µ, τ . Se gliautostati di massa, cioe gli stati che diagonalizzano la matrice M , sono differenti da quelli disapore,cioe dal vettore (νe, νµ, ντ ), allora ci sara una matrice analoga alla matrice di Kobaiashi-Maskawa che collega le due basi: νe

νµντ

=

φ11 φ12 φ13

φ21 φ22 φ23

φ31 φ32 φ33

f1

f2

f3

,

Page 277: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 277

dove abbiamo indicato con fa, a = 1, 2, 3 gli autostati di massa.Sebbene la prima evidenza della massa del neutrino fu annunciata solo i primi di giugno del199860 alla ’XVIIIth International Conference on Neutrino Physics and Astrophysics’ tenutasia Takayama, in Giappone, come risultato dell’esperimento ’superKamiokande’, tale possibilitafu gia proposta dal fisico italiano (ma che all’epoca si era da poco trasferito definitivamentein Russia) Bruno Pontecorvo61 nel 1957. Il punto e che un neutrino, diciamo ad esempio unνµ, prodotto in una determinata regione dello spazio, si muovera come sovrapposizione degliautostati di massa che infatti soddisferanno tre distinte equazioni di Dirac (lo si verifichi comeesercizio!) e si propagheranno percio in maniera indipendente. Un rivelatore del neutrino agrandi distanze vedra percio in generale una diversa sovrapposizione di stati, che al tempo tgiungeranno al rivelatore con fasi differenti. Pertanto, riespresso in termini degli autostati disapore,62 lo stato che descrivera il neutrino sara in generale diverso da quello iniziale e appariracome combinazione lineare degli autostati di sapore. La probabilita di rilevare il neutrino comeun neutrino elettronico oppure tauonico sara percio diversa da zero e dipendera dal tragittopercorso.Le oscillazioni dei neutrini implicano dunque delle differenze di massa tra i diversi tipi dineutrini, tuttavia non permettono una misura diretta delle masse, che tra l’altro risultanoessere troppo piccole per essere misurate senza difficolta, ed e stato finora possibile dare dellestime per i limiti superiori delle masse. In particolare non e detto che tutti i tipi di neutrino(noti) abbiano massa differente da zero. Il fatto che le masse dei neutrini siano molto piccolepone un problema nuovo: se il meccanismo con cui i neutrini acquistano massa fosse lo stessoche nel caso dei quark, sarebbe naturale aspettarsi per i neutrini una massa dello stesso ordinedi grandezza delle masse dei quark. A questo punto e interessante notare che, se i neutrinifossero di Majorana, allora vi e una possibile meccanismo diverso di assegnare la massa aineutrini, che ora descriveremo brevemente.

14.3.1 Il meccanismo dell’altalena (Seesaw mechanism).

Nel modello standard il numero leptonico e conservato. Se i neutrini hanno massa, devonocomparire dei termini quadratici nei campi dei neutrini. Tuttavia e facile vedere che terminidi questo tipo che non violino il numero leptonico non possono esserci in assenza di neutrini ditipo right. Devono allora esistere dei neutrini righta, che si indicano tipicamente con NR

i , chesi accoppiano con i neutrini left in termini della forma mD(νNR + NRν). Il coefficiente mD,che piu in generale sara una matrice, si chiama termine di massa di Dirac e come suddetto ci siaspetta che sia dell’ordine della scala di energia tipica del modello elettrodebole. Se il numeroleptonico e effettivamente conservato, allora qui finisce la storia.Se pero ad esempio almeno i neutrini right fossero di Majorana, allora essi violerebbero certa-mente il numero leptonico, dato che un neutrino, essendo reale, puo trasformarsi nel proprioantineutrino (essendo coincidenti). Cio permetterebbe di aggiungere allora termini di massa

60ma il risultato definitivo delle misura delle oscillazioni dei neutrini e stato pubblicato su Physical ReviewD solamente nell’ottobre 2006!

61fratello del regista Gillo62gli esperimenti che rivelano i neutrini sono basati sui processi nei quali si osservano i sapori leptonici!

Page 278: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 278

diagonali. Nella base ordinata (νi, NRi ) la matrice di massa puo allora assumere la forma

M =

(0 mD

mD mM

).

La matrice mM e la matrice di massa di Majorana. Poiche i campi right sono per il restocompletamente disaccoppiati da tutti gli altri campi, non vi e alcun meccanismo (simmetrie) cheprevenga gli autovalori di mM dall’essere arbitrariamente elevati, ad esempio alle scale di energiain cui si verifichi una eventuale grande unificazione (si noti che nelle teorie di grande unificazionetipicamente il numero leptonico non si conserva, si vedano i paragrafi successivi). Gli autostatidi massa dei neutrini si determinano allora diagonalizzando la matrice M . Nell’approssimazionein cui mM mD indicando sempre con le stesse lettere gli ordini di grandezza degli autovaloridelle matrici date, avremo che i neutrini right avranno massa mR ≈ mM , mentre i neutrini leftavranno massa

mL ≈m2D

mM

,

che giustificherebbe le piccolissime masse dei neutrini osservati. Le masse dei neutrini rightsaranno invece notevolmente elevate, rendendoli pertanto non osservabili.

14.4 Teorie GUT (cenni).

Il modello standard e il meccanismo di rottura spontanea suggeriscono l’idea di una possibileunificazione delle forze. Nel modello elettrodebole il gruppo U(1)em emerge dalla rottura disimmetria. La struttura in prodotti U(1)Y ×SU(2)L×SU(3)C del gruppo del modello standardpotrebbe in modo simile essere conseguenza di una rottura spontanea di simmetria da un unicogruppo G che per mezzo di un meccanismo analogo a quello di Higgs porta alla rottura

G −→ U(1)Y × SU(2)L × SU(3)C −→ U(1)em × SU(3)C .

Il gruppo G si chiama allora il gruppo di grande unificazione e la teoria relativa e detta GUT(Grand Unification Theory). Cio che alletta nella ricerca di una teoria GUT non e solamentel’idea di unificare le forze, ma la spiegazione della quantizzazione della carica. Nel modellostandard infatti la carica Q = τ3 + Y

2non e automaticamente quantizzata. Cio avviene per il

fatto che a differenza di τ3 che assume solo valori discreti, Y essendo associato a un gruppo U(1)non semplice, puo assumere qualunque valore e i valori discreti gli vengono imposti in seguito alleosservazioni sperimentali. Se invece U(1)Y , come avviene per il sottogruppo U(1) generato daτ3, fosse un sottogruppo di un gruppo compatto e semplice, allora sarebbe anch’egli quantizzatoin modo naturale, e cio potrebbe fornire una giustificazione teorica della quantizzazione dellacarica.

14.4.1 Il modello SU(5). Il piu semplice modello di GUT e quello con gruppo G = SU(5),benche non sia storicamente il primo. Anzitutto SU(5) contiene il gruppo SU(2)×SU(3) comematrici diagonali a blocchi. Sappiamo anche dalla teoria che SU(5) ammette quattro rappre-sentazioni fondamentali, due di dimensione 5 e due di dimensione 10. In fisica e usuale chiamare

Page 279: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 279

fondamentale solamente la rappresentazione di dimensione 5 associata al peso massimale L1.Essa viene indicata con 5. La sua coniugata, associata al peso massimale L1+L2+L3+L4, vieneindicata con 5∗. La rappresentazione di dimensione 10 associata al peso L1 +L2 e che si ottienedal prodotto esterno 5 ∧ 5 viene indicata con 10 e la sua coniugata con 10∗. In particolarela 10 viene realizzata sullo spazio delle matrici antisimmetriche. Tipicamente si fissa una baseper l’algebra di SU(5) data da matrici − i

2µi15

i=1, dove µi sono matrici hermitiane a traccianulla, normalizzate con la regola Trµiµj = 2δij (che ovviamente non identifica univocamentela base). Esse possono essere costruite ad esempio sulla falsa riga delle matrici di Gell-Mann.Per fissare le idee scegliamo la base

µi =

(λi 00 0

), per i = 1, . . . , 8

µi =

(0 00 σi−8

), per i = 9, . . . , 11

µ12 =1√15diag2, 2, 2,−3,−3 ,

dove λi e σj sono ovviamente le matrici di Gell-Mann e di Pauli mentre le restanti 12 matricihanno elementi di matrice non nulli

µ131,4 = µ134,1 = 1 , µ141,4 = −µ144,1 = −i , µ152,4 = µ154,2 = 1 ,

µ162,4 = −µ164,2 = −i , µ173,4 = µ174,3 = 1 , µ183,4 = −µ184,3 = −i ,µ191,5 = µ195,1 = 1 , µ201,5 = −µ205,1 = −i , µ212,5 = µ215,2 = 1 ,

µ222,5 = −µ225,2 = −i , µ233,5 = µ235,3 = 1 , µ243,5 = −µ245,3 = −i .

Tra le quattro matrici diagonali, oltre alle due di SU(3) e a quella di SU(2), compare µ12. Essacommuta con le prime 11 matrici, ovvero con SU(2) × SU(3) e puo percio essere identificata,a meno di un fattore costante, con l’operatore Y .

14.4.2 Le particelle in SU(5). Ricordando che ci sono 30 stati in una famiglia del modellostandard (includendo le antiparticelle), 15 potranno comparire nelle 5 e 10, e 15 nelle coniugate.Per poter inserire le particelle in SU(5), occorre analizzare come si comportano rispetto alsottogruppo SU(2) × SU(3) di SU(5), la qual cosa ci viene rivelata dal modello standard.Come usuale indicheremo con una coppia di numeri tale comportamento, dove il primo numerosi riferisce alla sottorappresentazione SU(2) e il secondo alla sottorappresentazione SU(3). Adesempio scriveremo per i quark up e down

(uαL, dαL) ∈ (2, 3) ,

per intendere che essi trasformano come un doppietto per SU(2) e nella fondamentale 3 perquanto riguarda l’indice di colore α. In pratica (a, b) e una notazione per individuare larappresentazione prodotto tensore [a] ⊗ [b] dove con [a] indichiamo una rappresentazione diSU(2) di dimensione a e con [b] una rappresentazione di SU(3) di dimensione b. Percio ladimensione di (a, b) e ab. I restanti 9 stati di particella sono

uαR ∈ (1, 3) , dαR ∈ (1, 3) , (νeL, e−L) ∈ (2, 1) , e−R ∈ (1, 1) ,

Page 280: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 280

ed ovviamente le antiparticelle. Naturalmente abbiamo

(1, 3) + (2, 1) = 5 , (1, 3∗) + (2∗, 1) = 5∗ .

Per quanto riguarda la 10 osserviamo che

10 = 5 ∧ 5 = ((1, 3) + (2, 1)) ∧ ((1, 3) + (2, 1)) = (1, 1) + (2, 3) + (1, 3∗) .

Una realizzazione esplicita di tale struttura la si ottiene (si veda [CL] capitolo 14) identificandogli stati della 5 con

ψR = (d1R, d

2R, d

3R, e

+R,−νeR) ,

dove il numero e l’indice di colore, e quelli della 10 con

ψij = −ψji =1√2

0 u3

L −u2L u1

L d1L

−u3L 0 u1

L u2L d2

L

u2L u1

L 0 u3L d3

L

−u1L −u2

L −u3L 0 e+

L

−d1L −d2

L −d3L −e+

L 0

,

dove si e usata la barra per indicare l’antiparticella, tranne che per il positrone. Come primail numero rappresenta l’indice di colore. La carica delle particelle e allora Q = τ3 + Y

2dove

τ3 =1

2µ11 , Y = −

√5

3µ12 .

14.4.3 I campi di gauge. In modo simile si ottiene l’analisi dei campi di gauge. Larappresentazione aggiunta di SU(5) ha dimensione 24 e si ottiene dalla decomposizione

5⊗ 5∗ = 24⊕ 1 ,

da cui si ottiene immediatamente

24 = (1, 8) + (3, 1) + (1, 1) + (2, 3) + (2, 3∗) .

La (1, 8) e l’aggiunta di SU(3) e corrisponde ai gluoni. La (2, 1) e l’aggiunta di SU(2) eindividua i bosoni vettori della teoria debole. (1, 1) e il campo di gauge U(1)Y dell’ipercarica.I rimanenti sono invece dei bosoni non contenuti nel modello standard, detti campi X e Y .Naturalmente ci si aspetta che il gruppo di unificazione sia spontaneamente rotto e che ilmeccanismo di rottura doti i campi X e Y di una massa estremamente elevata, ben superiorea quelle dei bosoni pesanti W± e Z0. Il problema del perche le rotture di simmetria

SU(5) −→ U(1)Y × SU(2)L × SU(3)C

eU(1)Y × SU(2)L −→ U(1)em

Page 281: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 281

debbano avvenire a scale di energia molto differenti viene indicato come il problema dellagerarchia.I campi X e Y , sono responsabili delle interazioni miste tra quark e leptoni (gli stati dettidi lepto-quark) o tra quark e antiquark (i diquark). Di conseguenza essi sono responsabili difenomeni che violano il numero barionico, quali il decadimento del protone in stati leptonici.L’osservata stabilita del protone (se decade deve farlo con una vita media di almeno 1035 anni)pone forti costrizioni alla teoria GUT. Non considereremo qui ulteriori dettagli (si veda [CL]capitolo 14).

14.4.4 Il modello SO(10). Storicamente il primo modello di teoria GUT fu realizzato conil gruppo di gauge SO(10). Il punto era che SO(10) ammette una rappresentazione spinorialechirale Spin(10)+ di dimensione 16, che poteva quindi accomodare i 15 stati del modello stan-dard, mentre gli altri 15 venivano inseriti nella rappresentazione Spin(10)−. Lo stato in piu eraattribuito al neutrino right e veniva abilmente fatto scomparire nella costruzione del modello.Per vedere come si possa costruire un modello GUT con gruppo SO(10), procediamo inveceall’inverso osservando anzitutto che SU(5) puo essere visto come sottogruppo di SO(10). Sescriviamo la generica matrice M dell’algebra so(10) in blocchi 5×5 (che indicheremo con letteregreche), allora si ha

A =

(α β−β γ

)dove α, β, γ ∈ M(5,R) e α e γ sono antisimmetriche. Tali blocchi corrispondono alladecomposizione

R10 = R5 ⊕ R5 = (x, y) ∈ R5 × R5 .La sottoalgebra delle matrici di so(10) per le quali γ = α mentre β e simmetrica a traccianulla, si identificano con su(5) tramite la mappa A 7→ A− iB agenti su C5 generato dai vettoriz = x+ iy.Si puo percio passare attraverso su(5) per individuare i campi del modello standard in so(10).Si ricordi che i pesi di spin(10)+ sono

ε =1

2(±L1 ± L2 ± L3 ± L4 ± L5)

per tutte le possibili combinazioni di segni che abbiano numero pari di segni −. Si osservi ancheche le radici positive di so(10) sono

Li ± Lj , 1 ≤ i < j ≤ 5 ,

dunque 20, mentre quelle di su(5) sono

Li − Lj , 1 ≤ i < j ≤ 5 .

Le sottorappresentazioni di su(5) in so(10) si ottengono quindi guardando come le radici disu(5) agiscono sui vettori peso di spin(10)+. Addizionando e sottraendo le radici di su(5) aipesi di spin(10)+ si vede che devono agire sui vettori peso conservando il numero di segni −.Si hanno percio tre sottospazi invarianti per su(5):

Page 282: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

14 GEOMETRIA DEL MODELLO STANDARD E GUT. 282

• un sottospazio unidimensionale corrispondente al peso massimo 12(L1+L2+L3+L4+L5) ≡

0, dato che per su(5) si ha L1 + L2 + L3 + L4 + L5 ≡ 0;

• un sottospazio 5−dimensionale corrispondente ai 5 pesi con 4 segni −. Il peso massimorispetto a su(5) e 1

2(L1 − L2 − L3 − L4 − L5) ≡ L1;

• un sottospazio 10−dimensionale corrispondente ai 10 pesi con 2 segni meno. In questocaso il peso massimo e evidentemente 1

2(L1 + L2 + L3 − L4 − L5) ≡ L1 + L2 + L3.

Quindi possiamo dire che spin(10)+ si decompone in 1 + 5 + 10∗ secondo le rappresentazionidi SU(5). Questo metodo puo essere ulteriormente applicato a SU(5) per decomporlo secondoSU(2) × SU(3) (in alternativa al metodo adottato nella sezione 14.4.2). Poiche una voltaindividuata la decomposizione, la costruzione delle funzioni d’onda e la stessa come in 14.4.2(con l’accortezza di aggiungere il neutrino right nel singoletto), non consideriamo qui ulterioridettagli. Si veda eventualmente [CL2], capitolo 14.

14.4.5 Esercizio. Si costruisca l’analoga decomposizione della rappresentazione aggiunta 45di SO(10) rispetto a SU(5).

Page 283: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

RIFERIMENTI BIBLIOGRAFICI 283

Riferimenti bibliografici

[A] M. Artin, Algebra, Bollati Boringhieri 1997.

[CDF] L. Castellani, R. D’Auria, P. Fre, Supergravity and Superstrings, Vol. 1, parte I, WorldScientific 1991.

[CL] T.-P. Cheng, L.-F. Li, Gauge theory of elementary particle physics, Oxford UniversityPress, 2004.

[CL2] T.-P. Cheng, L.-F. Li, Gauge theory of elementary particle physics: Problems andsolutions, Oxford University Press, 2000.

[dC] M.P. do Carmo, Riemannian geometry, Birkhauser Boston, 1992.

[D] R.W.R. Darling, Differential forms and connections, Cambridge University Press, 1994.

[DNF1] B.A. Dubrovin, S.P. Novikov, A.T. Fomenko, Geometria delle superfici, dei gruppi ditrasformazioni e dei campi, Editori Riuniti 1987.

[DNF2] B.A. Dubrovin, S.P. Novikov, A.T. Fomenko, Geometria e topologia delle varieta,Editori Riuniti 1988.

[FH] W. Fulton, J. Harris, Representation Theory, GTM 129, Springer 1991.

[Ha] B.C. Hall, Lie groups, Lie algebras, and representations, GTM 222, Springer 2003.

[Hu] J.E. Humphreys, Introduction to Lie algebras and representation theory, GTM 9, Springer1978.

[KN] S. Kobayashi, K. Nomizu, Foundations of differential geometry, Vol. I. Wiley ClassicsLibrary. A Wiley-Interscience Publication. John Wiley & Sons, Inc., 1996

[Lie] Sito: http://www-math.univ-poitiers.fr/ maavl/

[MB] S. Mac Lane, G. Birkhoff, Algebra, Mursia.

[N1] G.L. Naber, Topology, geometry, and gauge fields, Foundations, TAM 25, Springer 1997.

[N2] G.L. Naber, Topology, geometry, and gauge fields. Interactions, AMS 141. Springer 2000.

[S] J-P. Serre, Linear representations of finite groups, GTM 42, Springer 1977.

[T] W. Thirring, Classical mathematical physics. Dynamical systems and field theories,Springer 1997.

[We] S. Weinberg, The Quantum Theory of Fields, Vol. 1, Cambridge University Press.

[Wa] F.W. Warner, Foundations of differentiable manifolds and Lie groups, GTM 94, Springer1983.

Page 284: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

Indice analitico

Adroni, 265Aggiunta, Ad, 84aggiunta, ad, 86Algebra

di Clifforded elettrone, 251

di Poincare, 244Algebra di Lie, 87Algebra di Lie semplice, 94Angolo di Cabibbo, 275Angolo di Weinberg, 273Antiparticella, 261Applicazione liscia, 59Atlante, 58Azione

per l’equazione di Dirac, 255

Barioni, 266Bellezza, 266Bosone di Higgs, 269

Calibrazione, 230Camera di Weyl, 148Camera di Weyl di sl(3), 112Cammino, 64Campbell-Baker-Hausdorff, 89Campi di gauge

costruzione euristica, 230Campi di materia, 227

calibrabili o gauge covarianti, 230Campo

orizzontale, 214vettoriale

fondamentale, 202verticale, 202

Campo di gauge, 230, 232Campo hamiltoniano, 78Campo scalare, 249

carico, 250con potenziale, 250libero, 249

Campo spinoriale, 251Campo vettoriale

di Spin 1, 262Carattere, 30Carta locale, 58Chiralita, 253

e parita, 256Ciclo, 37Classe di coniugio, 37Colori, 268Complessificazione

di SO(1, 3), 261Confinamento, 268Connessione, 198

G-connessione, 203di Koszul, 205di Levi-Civita, 215

e vielbein, 218in coordinate locali, 220

di Spin, 263e cambiamento di carta locale, 219e campi di gauge, 233metrica, 215su spazi affini, 198su un fibrato differenziale, 201

Connessione infinitesimaG-connessione infinitesima, 204e derivata covariante, 208su un fibrato principale, 203su un fibrato vettoriale, 202sul fibrato duale, 203sul fibrato prodotto, 203

coordinate normali, 220Costante cosmologica, 242Cromodinamica, 275Curvatura, 211

e campo di forze, 234forma di, 211rispetto a un sistema di coordinate, 220rispetto a un vielbein, 218

284

Page 285: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

INDICE ANALITICO 285

scalare, 216sezionale, 217tensore di, 212

Decadimento del protone, 281Decomposizione di Jordan, 96Derivata covariante, 205

sul prodotto di fibrati, 208direzionale, 207e connessione infinitesima, 210e trasporto parallelo, 209sul fibrato duale, 209

Derivata di Lie, 81Derivata esterna, 69Derivazione, 63Diagramma di Dynkin, 140Diagramma di Young, 41Diffeomorfismo, 58Differenziale di un’applicazione liscia, 64Differenziale di una funzione liscia, 65Diquark, 281Distribuzione, 201

differenziale, 201involutiva, 201

Doppietto isotopico, 265Dualita, 230

Elettrone, 253Elicita, 248Equazione

di Dirac, 253di Klein-Gordon, 249di Maurer-Cartan, 195di struttura, 212

I, 214II, 212

Equazione di Newton, 74Equazioni di Einstein, 240Equazioni di Hamilton, 78Esponenziale, 89Estensione centrale, 246

Famiglie leptoniche, 265Fibrato, 186

associato, 191banale, 187dei riferimenti, 190differenziale, 192duale, 189principale, 190prodotto, 189spinoriale, 263sulla sfera, 193vettoriale, 186

Fibrato tangente, 65Flusso di un campo vettoriale, 79Forma

di Cartan, 194di curvatura, 211di torsione, 214orizzontale canonica, 214tensoriale, 209

Forma canonica (sul fibrato cotangente), 73Forma di Killing, 194

per gruppi semisemplici, 195Forma differenziale, 69Forma quadratica, 157Formula di Cartan, 81Forze di marea, 240Funzione hamiltoniana, 78Funzione liscia, 59Funzioni equivarianti, 209

Geometriadei gruppi di Lie, 194

Germe, 63Groupring, 36Gruppo

di Lorentzproprio ed ortocrono, 249

di SpinSpin(1, 3), 258

Gruppo di Lie, 83Gruppo di simmetria, 228Gruppo di Weyl di sl(3), 107Gruppo ortogonale, 62, 158Gruppo speciale, 61

Page 286: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

INDICE ANALITICO 286

GUT, 278modello SO(10), 281modello SU(5), 278

Hooklength, 43

Ideale, 90Idempotente, 31Identita di Bianchi, 212

I, 215II, 212

Identita di Jacobi, 68Incanto, 266Interazioni di gauge, 235Invarianti di gauge, 230Ipercarica, 269

Legge di Sylvester, 157Lemma di Schur, 29Lepto-quark, 281Leptoni, 265Luce pesante, 269

W±, Z0, 273

Mappa regolare, 139Massa dei neutrini, 276Matrice di Kobaiashi-Maskawa, 275Matrice jacobiana, 58Matrici

Γ, 256di Dirac, 254, 256di Gell-Mann, 275di Pauli, 254, 256

Meccanica Hamiltoniana, 77Meccanismo

di Higgs, 272Mesoni, 266Misura invariante, 197

per SU(2), 198Modello

elettrodebole, 270standard, 270

Neutrino, 253Nondegenere, 157

O(1,1), 160Omomorfismo di gruppi di Lie, 83Operatore

coniugazione di carica, 260di Dirac, 252

Oscillazioni dei neutrini, 277

Parentesi di Lie, 68Partizione, 37Peso dominante, 149Peso massimale, 149Piccolo gruppo, 245Positrone, 261Precessione di Thomas, 224Principio di equivalenza, 237

debole, 238forte, 238

Principio di relativita generale, 239Problema della gerarchia, 281Proiettore, 31Pull-back (di forme differenziali), 70Pullback, 79Pushforward, 80

Quarkbeauty, 266charm, 266down, 266strange, 266top, 266up, 266

Radice semplice, 139Radici positive, 139Rango di un fibrato, 186Rango di una mappa liscia, 60Rappresentazione

di Dirac, 254di Spin

di SO(1, 3), 256intrinsecamente proiettiva, 246proiettiva, 246

Rappresentazione di un algebra di Lie, 87Rappresentazione di un gruppo di Lie, 84

Page 287: Note Metodi geometrici per la sica matematica - mat.unimi.it · Note Metodi geometrici per la sica matematica Anno Accademico 2008-2009 S. Cacciatori B. van Geemen versione 07.0 1

INDICE ANALITICO 287

Rappresentazione fondamentale, 152Rappresentazione regolare, 34Relazione di cociclo

per rappresentazioni proiettive, 246Reticolo dei pesi, 146Reticolo delle radici, 147Ricoprimento universale, 248

Scalare di curvatura, 216Seesaw mechanism, 277Sezione

di un fibrato, 188e funzioni equivarianti, 209

globale, 188locale, 188

Simboli di Christoffel, 207, 219Simmetrie

esterne, 227interne, 227

Simmetrie di gauge, 230Simmetrie interne

e relativita, 237Simmetrizzatore di Young, 42Sistema delle radici di sl(3), 107Sistema di radici duali, 143Sistema di riferimento ruotante, 221Sommersioni, 60Sottogruppo di Lie, 83Sottogruppo di Lie immerso, 83Sottospazio

orizzontale, 201Sottovarieta, 60Spazio cotangente, 65Spazio degli invarianti, 31Spazio tangente, 63Spinori

di Majorana, 259Stranezza, 266Struttura Riemanniana, 215Struttura simplettica, 78Strutture geometriche, 186

Riemanniane, 213, 215

Tensore

di curvatura, 212simmetrie, 216

di Einstein, 216di Ricci, 216di Riemann, 216di torsione, 214

Teoremadi Frobenius, 211

Teorie di grande unificazione, 278Teorie di Yang-Mills, 234Torsione

forma di, 214rispetto a un sistema di coordinate, 219rispetto a un vielbein, 218tensore di, 214

Trasformazione di gaugedella connessione, 233della curvatura, 234

Trasformazioni, 228di gauge, 230esterne, 228interne, 228

Trasformazioni di simmetria, 228Trasporto parallelo, 198, 201

su spazi affini, 198sulla sfera S2, 199

Varieta differenziabile, 59Vettore tangente, 63Vielbein, 218

e connessione di Levi-Civita, 218e curvatura, 218e tensore di torsione, 218