Appunti per il corso di Metodi Algebrici -...

36
Appunti per il corso di Metodi Algebrici Enrico Gregorio Anno accademico 2002–2003 [email protected] Dipartimento di Informatica—Settore di Matematica Universit` a di Verona

Transcript of Appunti per il corso di Metodi Algebrici -...

Appunti per il corso diMetodi Algebrici

Enrico Gregorio

Anno accademico 2002–2003

[email protected]

Dipartimento di Informatica—Settore di MatematicaUniversita di Verona

CAPITOLO 1

Serie di potenze

1.1. Polinomi

Se A e un anello commutativo, come sempre in questi appunti, abbiamo definito l’anello deipolinomi A[x] come l’insieme delle successioni

(an) = (a0, a1, . . . , an, . . . )

in A che sono definitivamente nulle, cioe per le quali esiste un n tale che

an = 0, per ogni n > n.

Su questo insieme abbiamo definito le operazioni di addizione e moltiplicazione con

(an) + (bn) = (sn)

(an)(bn) = (pn)

dove sn = an + bn e

pn =n∑

i=0

aibn−i =∑

i+j=n

aibj .

Non e difficile dimostrare che A[x] e un anello, in cui l’elemento neutro per l’addizione e lasuccessione costante 0 e quello per la moltiplicazione e (1, 0, . . . , 0, . . . ).

Si e poi notato che l’applicazione j : A → A[x] definita da

j(a) = (a, 0, . . . , 0, . . . )

e un omomorfismo iniettivo di anelli e che e possibile identificare, tramite j, A con un sottoanellodi A[x]. Se poi si pone

x = (0, 1, 0, . . . , 0, . . . ),

si ha che

xn = (0, . . . , 0,

n↓

1, 0, . . . , 0, . . . )

e ci si accorge che ogni polinomio f ∈ A[x] si puo scrivere in modo unico come

f = a0 + a1x + a2x2 + · · ·+ anxn

(intendendo che non e rilevante per l’unicita se aggiungiamo o togliamo termini con coefficientinulli). Se il polinomio non e nullo, possiamo supporre comunque che an 6= 0; in tal caso n e ilgrado di f , che si indica anche con ∂(f). Il grado del polinomio nullo e, per convenzione, −∞.

Scrivere i polinomi in questo modo permette di eseguire i calcoli in modo usuale, senzaricorrere alla formula complicata per i prodotti: basta osservare che A[x] e un anello commutativoe quindi ridurre i termini simili.

Quando l’anello A e un campo, sappiamo che A[x] e un dominio euclideo e quindi ogni suoideale e principale. Se I e un ideale di A[x] e I 6= {0}, basta prendere in I un elemento di gradominimo (e possiamo scegliere l’unico polinomio monico con tale grado) f e si ha

I = fA[x] = { fg | g ∈ A[x] }.

1

2 1. SERIE DI POTENZE

Dal momento che ∂(fg) = ∂(f) + ∂(g), quando A e un dominio, sappiamo che gli elementiinvertibili di A[x] sono esattamente gli elementi invertibili di A.

Tuttavia, riflettendo sulle dimostrazioni che permettono di concludere che A[x] e un anello,non e difficile convincersi che anche l’insieme di tutte le successioni in A e, con le operazionidefinite allo stesso modo, un anello, che denoteremo con A[[x]].

Proviamo allora a calcolare il prodotto delle successioni (an) e (bn), dove

an =

1 se n = 0−1 se n = 10 se n > 1

e bn = 1, per ogni n.

Questo prodotto e (pn), dovepn =

∑i+j=n

aibj .

In particolare

p0 = a0b0 = 1 = 1 · 1,

p1 = a1b0 + a0b1 = (−1) · 1 + 1 · 1 = 0,

p2 = a2b0 + a1b1 + a0b2 = 0 · 1 + (−1) · 1 + 1 · 1 = 0.

Piu in generale, sapendo che an = 0, per n > 1, si ha, sempre per n > 1,

pn =∑

i+j=n

aibj = a1bn−1 + a0bn = (−1) · 1 + 1 · 1 = 0.

In altre parole la successione (pn) e proprio l’elemento neutro del nuovo anello.

1.2. Serie

Il risultato precedente non dovrebbe essere troppo sorprendente, se ci si ricorda della teoriadelle serie di potenze. In effetti, e noto che

∞∑n=0

zn =1

1− z

per ogni numero reale (o anche complesso) z tale che |z| < 1. Quello che abbiamo scritto primae una “dimostrazione” di questa identita. Occorre una piccola osservazione: una serie di potenzee determinata univocamente dalla successione dei coefficienti. In questo caso si tratta propriodella costante 1.

Che poi stiamo lavorando in modo analogo alle serie di potenze risulta dal fatto che ilprodotto da noi definito sulle successioni corrisponde proprio al prodotto di Cauchy delle serie.

Proviamo di nuovo a dimostrare l’identita:

(1− z)∞∑

n=0

zn =∞∑

n=0

zn −∞∑

n=0

zn+1

= 1 +∞∑

n=1

zn −∞∑

n=1

zn = 1.

Nell’ultimo passaggio abbiamo spezzato la prima somma, mettendo in evidenza il termine pern = 0, e abbiamo cambiato l’indice nella seconda, con n + 1 → n. Dov’e l’inghippo in questa“dimostrazione”?

Non si tratta di una dimostrazione scorretta, tuttavia abbiamo usato proprieta delle serieche vanno giustificate; altrimenti si possono ottenere assurdita come

. . .1zn

+ · · ·+ 1z2

+1z

+ 1 + z + z2 + · · ·+ zn + · · · = 0.

1.2. SERIE 3

Infatti, la somma a sinistra fino all’1 e quella di una progressione geometrica di ragione 1/z,quindi e

1

1− 1z

=z

z − 1;

quella dall’1 in poi e 1/(1− z) e, avendo contato due volte il termine 1, la somma ez

z − 1+

11− z

− 1 = 0.

E evidente che il ragionamento e assurdo; lo e per molti motivi, ma il principale e che nonabbiamo tenuto in minimo conto la convergenza. Infatti la serie a sinistra converge solo quando|z| > 1 e quella di destra solo quando |z| < 1: non esistono valori nei quali entrambe le serieconvergano.

Nel caso della serie geometrica non ci sono difficolta, per via dei noti teoremi sulle serieassolutamente convergenti, che permettono manipolazioni algebriche su queste serie.

Eppure il ragionamento della sezione precedente funzionava senza parlare di convergenza,poiche si basava solo sulle proprieta algebriche delle operazioni. Abbiamo applicato la definizionee trovato esattamente quello che ci serviva.

Proviamo a risolvere un’altra questione: data una successione (an) in A[[x]], cerchiamo lasua inversa (bn). Dobbiamo quindi risolvere le infinite equazioni

a0b0 = 1,a1b0 + a0b1 = 0a2b0 + a1b1 + a0b2 = 0. . .

n∑i=0

an−ibi = 0

. . .

Dalla prima ricaviamo che b0 = a−10 , cioe che a0 deve essere invertibile in A. In tal caso possiamo

anche risolvere tutte le altre: per n > 0 si deve avere

bn = −a−10

n−1∑i=0

an−ibi

e, per induzione, abbiamo definito la successione (bn) che cercavamo. E ovvio che, con questascelta, (an)(bn) = 1, dove 1 denota l’elemento neutro di A[[x]], cioe la successione (1, 0, . . . , 0, . . . ).

Ad esempio, per a0 = 1, a1 = −1 e an = 0 per n > 1, le equazioni sono: b0 = 1, b1 =(−1) · ((−1) · 1) = 1, e, per induzione,

bn = −a−10 (a1bn−1) = (−1) · ((−1) · 1) = 1.

Pero possiamo anche trovare l’inversa della successione (n!) che ha senso per esempio quandoA = R:

b0 = (0!)−1 = 1

b1 = −(0!)−1(1! b0) = −1

b2 = −(0!)−1(2! b0 + 1! b1) = −1

b3 = −(0!)−1(3! b0 + 2! b1 + 1! b2) = −3

b4 = −(0!)−1(4! b0 + 3! b1 + 2! b2 + 1! b3) = −13. . .

4 1. SERIE DI POTENZE

Questo non ha alcun corrispettivo nelle serie di potenze: infatti la serie di potenze∑

n(n!)zn

converge solo per z = 0. Tuttavia la manipolazione algebrica da un risultato ben definito;vedremo presto che cosa significa.

Un altro esempio: cerchiamo l’inversa della successione (an) = (1,−1,−1, 0, . . . , 0, . . . ).Avremo

b0 = a−10 = 1

b1 = −a−10 (a1b0) = 1

b2 = −a−10 (a2b0 + a1b1) = 2

b3 = −a−10 (a3b0 + a2b1 + a1b2) = 3

. . .

bn+2 = −a−10 (a2bn + a1bn+1) = bn + bn+1

quindi la successione cercata e esattamente la successione di Fibonacci. Esercizio: trovare ilraggio di convergenza della serie che ha come coefficienti quelli della successione di Fibonacci.

1.3. Serie formali

L’anello A[[x]] si chiama anello delle serie formali a coefficienti in A. Cominciamo a vederein modo piu rigoroso alcune delle sue proprieta. Per rendere le cose piu semplici, tratteremo ilcaso in cui A e un campo; questo e comunque il caso piu importante.

Useremo alcune notazioni fisse; gli elementi di A[[x]] saranno denotati con lettere come f e g.Se f ∈ A[[x]], essa e una successione, i cui termini si indicano con fn. Percio

f = (f0, f1, . . . , fn, . . . ).

Il minimo n tale che fn 6= 0 si chiama ordine di f e si indica con o(f). Per lo zero di A[[x]], chedenoteremo con 0, l’ordine e ∞.

Un particolare elemento di ordine n e

xn = (0, . . . , 0,

n↓

1, 0, . . . , 0, . . . ).

In effetti ogni polinomio e un elemento di A[[x]], quindi A[x] e un sottoanello di A[[x]].Cominciamo con un fatto che abbiamo gia visto.

Proposizione 1.3.1. Un elemento f ∈ A[[x]] e invertibile se e solo se f0 6= 0, cioe se e solose o(f) = 0.

Proposizione 1.3.2. Se f, g ∈ A[[x]], allora:(1) o(f + g) ≥ min{o(f), o(g)};(2) o(fg) = o(f) + o(g).

Dimostrazione. Se n < min{o(f), o(g)}, abbiamo fn = gn = 0 e quindi (f + g)n = 0.Se f = 0, allora fg = 0g = 0 e l’uguaglianza e provata. Possiamo allora supporre che

entrambe le successioni siano non nulle.Poniamo a = o(f) e b = o(g); allora

(fg)a+b =∑

i+j=a+b

figj = fagb 6= 0;

inoltre, se n < a + b,(fg)n =

∑i+j=n

figj = 0,

perche fi = 0, per i < a, e gj = 0, per j < b. �

1.3. SERIE FORMALI 5

Ricordiamo che due elementi a, b di un anello commutativo si dicono associati se esiste unelemento invertibile u tale che b = au.

Lemma 1.3.3. Se f ∈ A[[x]] e non nullo, con o(f) = d, allora f e associato a xd.

Dimostrazione. Abbiamo fi = 0 per i < d e fd 6= 0. Possiamo allora considerare lasuccessione g ∈ A[[x]] tale che

gn = fd+n.

Si verifica immediatamente che f = xdg; poiche g e invertibile, si ha la tesi. �

E chiaro che xd non e associato a xk, se d 6= k.

Proposizione 1.3.4. L’anello A[[x]] e un dominio a ideali principali e ammette un unicoideale massimale, formato dagli elementi non invertibili.

Dimostrazione. Che A[[x]] sia un dominio segue dalla Proposizione 1.3.2, perche, se f 6= 0e g 6= 0, l’ordine di fg e finito.

Consideriamo l’insieme degli elementi non invertibili, che sono quelli di ordine > 0. La som-ma di due tali elementi e allora non invertibile. Se moltiplichiamo un elemento non invertibileper uno qualunque, otteniamo un elemento non invertibile (questo vale in ogni anello, eserci-zio). Dunque gli elementi non invertibili di A[[x]] formano un ideale, che e per forza massimale(esercizio; suggerimento: se un ideale contiene propriamente questo, deve contenere un elementoinvertibile).

Vediamo ora che ogni ideale I di A[[x]] e principale. La dimostrazione e simile a quella cheabbiamo dato per A[x]. Se I = {0}, allora I = 0A[[x]]. Supponiamo allora che I 6= {0}; in talcaso in I troviamo elementi di ordine finito e quindi uno di ordine minimo, diciamo d. Pertanto,per il lemma 1.3.3, xd ∈ I e dunque xdA[[x]] ⊆ I.

Verifichiamo allora l’inclusione inversa. Sia f ∈ I; allora o(f) ≥ d. Possiamo allora scriveref = xkg, dove g e invertibile. Ma allora

f = xkg = xdxk−dg ∈ xdA[[x]],

come si voleva. �

Corollario 1.3.5. L’insieme degli ideali di A[[x]] e totalmente ordinato per inclusione.

L’idea di considerare l’anello A[[x]] e di trattare in modo algebrico le serie di potenze, dimen-ticandosi della convergenza; i risultati che si ottengono possono nondimeno avere applicazionianche alle funzioni sviluppabili in serie di potenze, purche si sia cauti.

Identificheremo la successione f ∈ A[[x]] con la serie (formale) di potenze∑n

fnxn;

questa notazione ha solo lo scopo di facilitare i calcoli e le identita, come vedremo fra poco.Le serie formali infatti hanno notevole importanza nello studio delle successioni definite per

ricorrenza. Torniamo all’esempio della successione di Fibonacci, per A = R:

F0 = 1, F1 = 1, Fn = Fn−1 + Fn−2 (n > 1).

Abbiamo gia visto che F = (1 − x − x2)−1; cerchiamo di scrivere i termini della successione inun altro modo.

Cerchiamo di scrivere1

(1− x− x2)=

A

1− αx+

B

1− βx.

6 1. SERIE DI POTENZE

Questa e una procedura ben nota, ad esempio nel calcolo degli integrali delle funzioni razionali.E sufficiente che

A + B = 1Aβ + Bα = 0

α + β = 1αβ = −1

come polinomi, in particolare che α e β siano radici del polinomio x2 − x− 1. Se poniamo

α = ϕ =1 +

√5

2che si chiama spesso numero di Fidia, avremo

β =1−

√5

2= 1− ϕ.

Allora B = 1−A e, da A(1− ϕ) + (1−A)ϕ = 0 troviamo A(2ϕ− 1) = ϕ, cioe

A =ϕ√5, B = −1− ϕ√

5.

Perche scrivere cosı? La risposta e che conosciamo gia quanto vale (1−kx)−1 come serie formaledi potenze:

(1− kx)−1 =∑

n

knxn

perche si tratta della solita serie geometrica. Quindi:

11− x− x2

=1√5

1− ϕx− 1− ϕ

1− (1− ϕ)x

)=

1√5

(ϕ∑

n

ϕnxn + (1− ϕ)∑

n

(1− ϕ)nxn

)

=1√5

∑n

(ϕn+1 − (1− ϕ)n+1

)xn

e dunque

Fn =1√5

(ϕn+1 − (1− ϕ)n+1

)Per esercizio, controllare per i casi piccoli. Siccome∣∣∣∣ (1− ϕ)n+1

√5

∣∣∣∣ < 1/2,

un metodo per calcolare Fn e di arrotondare ϕn+1/√

5 all’intero piu vicino.Le serie di potenze formali danno un metodo potente per lo studio delle successioni definite

per ricorrenza, come si vedra.

1.4. Derivate e primitive

Non possiamo considerare una serie di potenze formale come una funzione; tuttavia possiamolo stesso usare alcuni metodi dell’analisi.

Se f ∈ A[[x]], definiamo la derivata di f come

f′ =∑

n

nfnxn−1.

1.4. DERIVATE E PRIMITIVE 7

Per essere pignoli occorrerebbe scrivere f′ = g, dove

gn = (n + 1)fn+1.

Definiamo anche la serie esponenziale

E =∑

n

1n!

xn,

cioe En = 1/n!. E allora evidente che E′ = E. Naturalmente, per fare questo, e necessario che lacaratteristica del campo A sia 0. Anche questa e un’ipotesi che faremo sempre, da ora in poi.

Proposizione 1.4.1. Se f, g ∈ A[[x]] e f′ = g′, allora esiste a ∈ A tale che f − g = a.

Dimostrazione. E banale, basta scrivere la condizione. �

Una possibilita in piu che abbiamo e di sostituire un serie in un’altra. In generale questo nonha senso, ad esempio non possiamo sostituire una costante, perche cio equivarrebbe a calcolareuna somma infinita. Invece, se prendiamo f e g dove o(g) > 0, la cosa si puo fare:

f(g) =∑

n

fngn.

Infatti o(gn) ≥ n, quindi ogni xn ha solo un numero finito di coefficienti non nulli. Ad esempioe possibile scrivere

f(−x) =∑

n

(−1)nfnxn,

percio1

1 + x=

11− (−x)

=∑

n

(−1)nxn.

Esercizio: dimostrare che E(−x) = E−1.

Proposizione 1.4.2. Se f, g ∈ A[[x]] hanno ordine maggiore di zero, allora

E(f + g) = E(f) · E(g).

Dimostrazione. Calcoliamo senza preoccuparci troppo delle verifiche, che comunque sonopossibili; ci ricordiamo solo del teorema del binomio che vale in ogni anello commutativo:

E(f + g) =∑

n

(f + g)n

n!=∑

n

( n∑i=0

1n!

(n

i

)f ign−i

).

D’altra parte

E(f) · E(g) =(∑

n

fn

n!

)(∑n

gn

n!

)=∑

n

( n∑i=0

f i

i!gn−i

(n− i)!

).

La verifica e conclusa ricordando che1n!

(n

i

)=

1n!

n!i!(n− i)!

,

percio le due serie sono uguali. �

Proposizione 1.4.3. Se f, g ∈ A[[x]], allora

(fg)′ = f′g + fg′.

Proposizione 1.4.4. Se f, g ∈ A[[x]] e o(g) > 0, allora

(f(g))′ = f′(g) · g′.

8 1. SERIE DI POTENZE

La dimostrazione non e troppo difficile, ma la omettiamo.Una serie con ordine 1 e quella logaritmica:

L =∑n≥1

(−1)n−1

nxn,

cioe L0 = 0 e Ln = (−1)n−1/n per n ≥ 1. Questa serie dovrebbe fare le veci di log(1 + x). Ineffetti e possibile dimostrare che E(L) = 1 + x.

Calcoliamo la derivata di L:

L′ =∑

n

(−1)nxn = (1 + x)−1.

Per a ∈ A, definiamo(1 + x)a = E(aL).

Le proprieta di questa serie sono:(1) (1 + x)0 = 1;(2) (1 + x)a · (1 + x)b = (1 + x)a+b.

Vogliamo trovare una espressione dei coefficienti della serie (1 + x)a. Poniamo(a

0

)= 1,

(a

n

)=

a(a− 1) . . . (a− n + 1)n!

(n > 0).

Dalla proposizione sulle “funzioni composte” abbiamo il seguentre risultato.

Corollario 1.4.5. La derivata di (1 + x)a e a(1 + x)a−1.

Proposizione 1.4.6. Vale la formula del binomio di Newton

(1 + x)a =∑

n

(a

n

)xn.

Dimostrazione. Poniamo fa =∑

n

(an

)xn. Allora

f′a =∑n≥1

n

(a

n

)xn−1.

Ma abbiamo anche

n

(a

n

)= a

(a− 1n− 1

)quindi

f′a =∑n≥1

a

(a− 1n− 1

)xn−1 = a

∑m

(a− 1

m

)xm = afa−1.

La stessa dimostrazione che vale nei numeri interi dice che(a− 1

n

)+(

a− 1n− 1

)=(

a

n

)(n ≥ 1).

Percio: ∑n≥1

(a− 1

n

)xn +

∑n≥1

(a− 1n− 1

)xn =

∑n≥1

(a

n

)xn,

cioe(fa−1 − 1) + xfa−1 = fa

e quindifa−1 = (1 + x)−1fa

da cuif′a = a(1 + x)−1fa.

1.5. RELAZIONI DI RICORRENZA 9

Ne segue che la derivata di fa · (1 + x)−a e

(fa · (1 + x)−a)′ = f′a · (1 + x)−a + fa · ((1 + x)−a)′

= a(1 + x)−1fa · (1 + x)−a + fa · (−a)(1 + x)−a−1

= 0.

Di conseguenza fa · (1 + x)−a ∈ A (e “costante”) e un esame dei coefficienti dice che

fa · (1 + x)−a = 1.

Basta allora moltiplicare per (1 + x)a per ottenere il risultato. �

Esiste anche l’operatore di integrazione:∫f =

∑n

fnn + 1

xn+1.

In altre parole∫

f e la successione g dove g0 = 0 e gn = fn−1, per n ≥ 1. Chiaramente la derivatadell’integrale di f e f.

1.5. Relazioni di ricorrenza

Una relazione di ricorrenza lineare e un’espressione del tipo

(*) tn = c1tn−1 + c2tn−2 + · · ·+ cktn−k,

con c1, c2, . . . , ck ∈ A. Una soluzione della relazione di ricorrenza data e f ∈ A[[x]] tale che

fn = c1fn−1 + c2fn−2 + · · ·+ ckfn−k

per n ≥ k. Diremo che k e l’ordine della relazione di ricorrenza.

Proposizione 1.5.1. Se f e g sono soluzioni di una data relazione di ricorrenza e a, b ∈ A,allora anche af + bg e una soluzione.

Siccome A[[x]] e uno spazio vettoriale su A, le soluzioni di una relazione di ricorrenza formanoun suo sottospazio.

Proposizione 1.5.2. La successione (an) =∑

n anxn e una soluzione di (*) se e solo se ae una radice del polinomio

tk − c1tk−1 − c2t

k−2 − · · · − ck−1t− ck.

Se per esempio A e il campo complesso, possiamo scrivere tutte le radici del polinomio etrovare k soluzioni linearmente indipendenti. Se le radici sono distinte il problema e risolto,perche si puo dimostrare che lo spazio delle soluzioni ha dimensione proprio k. Se una radice aha molteplicita d, si puo verificare che∑

n

anxn,∑

n

nanxn,∑

n

n2anxn, · · ·∑

n

nd−1anxn

sono anch’esse soluzioni di (*), linearmente indipendenti. Dunque anche in questo caso lesoluzioni si possono determinare.

Come esempio, rivediamo la successione di Fibonacci. Abbiamo che il polinomio caratteri-stico e

t2 − t− 1

le cui radici sono ϕ e 1− ϕ. Quindi ogni soluzione e della forma∑n

(aϕn + b(1− ϕ)n)xn

10 1. SERIE DI POTENZE

e possiamo determinare a e b imponendo le condizioni iniziali F0 = 1, F1 = 1. Infatti questo diceche {

a + b = 1aϕ + b(1− ϕ) = 1

che da subito a = ϕ/√

5 e b = −(1− ϕ)/√

5.Se la relazione di ricorrenza e invece

tn = −4tn−1 − 5tn−2 − 2tn−3,

il polinomio caratteristico e x3 + 4x2 + 5x + 2 = (x + 1)2(x + 2) e quindi le soluzioni sono tuttee sole quelle della forma ∑

n

(a(−1)n + bn(−1)n + c(−2)n)xn

e bastera imporre le condizioni iniziali.

1.6. Numeri di Catalan e Bell

Sia ∗ un’operazione non necessariamente associativa sull’insieme X. Se a1, a2, . . . , an sonoelementi di X, quanti prodotti con questi fattori posso eseguire? Ad esempio, se n = 3 oppure 4,abbiamo le seguenti possibilita:

a1 ∗ (a2 ∗ a3), (a1 ∗ a2) ∗ a3;a1 ∗ (a2 ∗ (a3 ∗ a4)), a1 ∗ ((a2 ∗ a3) ∗ a4),(a1 ∗ a2) ∗ (a3 ∗ a4),(a1 ∗ (a2 ∗ a3)) ∗ a4, ((a1 ∗ a2) ∗ a3) ∗ a4.

Chiamiamo Cn il numero di modi con n fattori e cerchiamo una relazione di ricorrenza ancheper questa successione. Porremo C0 = 0, C1 = 1 e C2 = 1.

Proposizione 1.6.1. Per n ≥ 2 si ha

Cn =n−1∑i=1

CiCn−i.

Dimostrazione. Si deve considerare l’ultima operazione eseguita, cioe il simbolo ∗ che stafuori dalle parentesi; se a sinistra ci sono i fattori, a destra ce ne sono n− i. I modi per scrivereun’espressione di questo tipo sono allora CiCn−i. �

Consideriamo allora C =∑

n Cnxn. Possiamo scrivere

C = C0 + C1x +∑n≥2

Cnxn

= x +∑n≥2

(n−1∑i=1

CiCn−i

)xn

= x +∑n≥2

(n∑

i=0

CiCn−i

)xn

= x +∑

n

(n∑

i=0

CiCn−i

)xn

= x + C2.

Ne segue cheC2 − C + x = 0

1.6. NUMERI DI CATALAN E BELL 11

da cui0 = C2 − C +

14− 1

4+ x

e quindi (C− 1

2

)2

=14− x

Conosciamo una serie di potenze che elevata al quadrato dia 1− 4x, cioe

(1− 4x)12 .

Poiche A[[x]] e un dominio, abbiamo che

C− 12

=12(1− 4x)

12 oppure C− 1

2= −1

2(1− 4x)

12

e dobbiamo scegliere la seconda, perche C0 = 0. Dunque

C =12− 1

2(1− 4x)

12 =

12− 1

2

∑n

(1/2n

)(−4)nxn.

Si tratta di semplificare il coefficiente (per n ≥ 1)

Cn = −12

(1/2n

)(−4)n = −1

2(−1)n22n

12

(12− 1)

. . .

(12− n + 1

)n!

= −12(−1)n22n 1(−1)(−3) . . . (3− 2n)

2nn!

= −12(−1)n22n(−1)n−1 (2n− 3)!!

2nn!

= 2n−1 (2n− 3)!!n!

dove r!! denota il semifattoriale di r:

r!! =

1 · 3 · . . . · r se r e dispari,2 · 4 · . . . · r se r > 0 e pari,1 se r = 0.

Ora, se r e dispari, diciamo r = (2s− 1), abbiamo

r!! = 1 · 3 · . . . · (2s− 1)2 · 4 · . . . · 2s

2s · s!=

(2s)!2s · s!

.

Nel nostro caso r = 2n− 3 = 2(n− 1)− 1 e quindi s = n− 1; quindi

Cn = 2n−1 (2n− 2)!2n−1(n− 1)!n!

=1n

(2n− 2)!(n− 1)! (n− 1)!

=1n

(2n− 2n− 1

).

Come altra applicazione calcoliamo i numeri di Bell, anche se in realta non arriveremo auna formula esplicita. Vogliamo determinare quante sono le possibili relazioni di equivalenza inun insieme con n elementi. Una relazione di equivalenza e data da una partizione e quindi cibasta contare queste. Sia dunque Bn il numero delle partizioni di un insieme con n elementi,che possiamo supporre sia {1, 2, . . . , n} se n > 0. Avremo B0 = 1, perche c’e un’unica partizionedell’insieme vuoto; inoltre e chiaro che B1 = 1 e anche che B2 = 2, dal momento che le partizionidi {1, 2} sono

{{1}, {2}} e {{1, 2}}.Per n = 3 le partizioni sono:

{{1}, {2}, {3}}, {{1}, {2, 3}}, {{2}, {1, 3}}, {{3}, {1, 2}}, {{1, 2, 3}},

12 1. SERIE DI POTENZE

dunque B3 = 5. Cerchiamo una relazione di ricorrenza; se F e una partizione di X ={1, 2, . . . , n}, con n > 1, l’elemento n deve stare in esattamente un elemento A di F . Que-sto A e un sottoinsieme di {1, 2, . . . , n} ed avra i elementi. Se togliamo A dalla partizione,otteniamo una partizione dell’insieme X \ A, che ha n− i elementi, e di queste ce sono Bn−i. Ipossibili modi di scegliere un sottoinsieme A di X che abbia i elementi e al quale n appartengasono esattamente il numero di sottoinsiemi di {1, 2, . . . , n − 1} che hanno i − 1 elementi, cioe(n−1i−1

). Dunque, sommando,

Bn =n∑

i=1

(n− 1i− 1

)Bn−i.

Ad esempio

B3 =(

3− 11− 1

)B3−1 +

(3− 12− 1

)B3−2 +

(3− 13− 1

)B3−3

=(

20

)B2 +

(21

)B1 +

(22

)B0

= 2 + 2 + 1 = 5;

B4 =(

4− 11− 1

)B4−1 +

(4− 12− 1

)B4−2 +

(4− 13− 1

)B4−3 +

(4− 14− 1

)B4−3

=(

30

)B3 +

(31

)B2 +

(32

)B1 +

(33

)B0

= 5 + 3 · 2 + 3 · 1 + 1 = 15.

Invece di calcolare direttamente B, calcoleremo l’espressione di

B =∑

n

Bn

n!xn

cioe porremo B = Bn/n!. Questa si chiama funzione generatrice esponenziale. Dimostreremocon metodi analoghi ai precedenti che

B = E(E− 1).

Notiamo che la sostituzione eseguita ha senso in astratto, visto che o(E− 1) = 1. Visto che perostiamo lavorando nei reali, questo dimostra che∑

n

Bn

n!xn = eex−1.

Calcoliamo la derivata di B:

B′ =∑n≥1

Bn

n!nxn−1 =

∑n≥1

( n∑i=1

(n− 1i− 1

)Bn−1

)1

(n− 1)!xn−1.

Invece il prodotto E · B vale:

E · B =(∑

n

1n!

xn

)(∑n

Bn

n!xn

)=∑m

( m∑j=0

1j!

Bm−j

(m− j)!

)xm.

Cambiamo j in i− 1 e m in n− 1, ottenendo che

E · B =∑n≥1

( n∑i=1

1(i− 1)!

Bn−i

(n− i)!

)xn−1 =

∑n≥1

( n∑i=1

(n− 1i− 1

)Bn−i

(n− 1)!

)xn−1

1.6. NUMERI DI CATALAN E BELL 13

e quindi che B′ = E · B. Ma allora

(E(1− E) · B)′ = E(1− E) · (−E) · B + E(1− E) · E · B = 0.

Di conseguenza E(1 − E) · B e costante e basta calcolare in 0 per ottenere che la costante e 1.Finalmente

B = (E(1− E))−1 = E(E− 1).Terminiamo con il calcolo di un’altra successione di una certa importanza; vogliamo trovare

il numero Tn delle permutazioni su n oggetti che non abbiano punti uniti; diremo che σ ∈ Sn

non ha punti uniti se σ(i) 6= i, per ogni i = 1, 2, . . . , n. Un punto unito corrisponde quindi a unciclo di lunghezza 1 nella decomposizione in cicli disgiunti; quindi dobbiamo calcolare il numerodelle permutazioni che si scrivono come

σ = (a11a12 . . . a1d1)(a21a22 . . . a2d2) . . . (ak1ak2 . . . akdk)

dove 1 < di ≤ n e d1 + d2 + · · ·+ dk = n.

Proposizione 1.6.2. Si ha T0 = 1, T1 = 0 e

Tn+1 = n(Tn + Tn−1) (n > 0).

Dimostrazione. Sia n > 0 e scriviamo una permutazione σ ∈ Sn+1 senza punti unitiin cicli disgiunti come prima; possiamo supporre che a11 = n + 1 e quindi, per ipotesi, 1 ≤σ(n + 1) ≤ n. Possiamo allora ripartire l’insieme S′n+1 delle permutazioni di Sn+1 senza puntiuniti in sottoinsiemi disgiunti

Ai = {σ ∈ S′n+1 | σ(n + 1) = i }.A loro volta gli insiemi Ai sono ripartiti in due sottoinsiemi disgiunti:

Bi = {σ ∈ Ai | d1 = 2 } e Ci = {σ ∈ Ai | d1 > 2 }.Una permutazione σ ∈ Bi e allora della forma

σ = (n + 1 i)(a21a22 . . . a2d2) . . . (ak1ak2 . . . akdk)

e quindiσ′ = (a21a22 . . . a2d2) . . . (ak1ak2 . . . akdk

)e una permutazione senza punti uniti di un insieme con n−1 elementi, precisamente {1, . . . , n}\{i}; anzi, da ogni permutazione senza punti uniti di questo insieme possiamo ottenerne una di{1, . . . , n, n + 1} aggiungendo il ciclo (n + 1 i). Percio il numero di elementi in Bi e esattamenteTn−1.

Analogamente una permutazione σ ∈ Ci e della forma

σ = (n + 1 i a13 . . . a1d1)(a21a22 . . . a2d2) . . . (ak1ak2 . . . akdk)

e ad essa possiamo associare la permutazione senza punti uniti

σ′′ = (i a13 . . . a1d1)(a21a22 . . . a2d2) . . . (ak1ak2 . . . akdk)

di {1, . . . , n}. Ancora, ad una permutazione senza punti uniti di {1, . . . , n} possiamo associarneuna di Ci. Dunque Ci ha esattamente Tn elementi.

Poiche i si puo scegliere in n modi, abbiamo la tesi. �

Cercheremo ancora la funzione generatrice esponenziale

T =∑

n

T

n!xn.

Dalla relazione di ricorrenza ricaviamo che∑n≥1

Tn+1

n!xn =

∑n≥1

Tn−1

(n− 1)!xn +

∑n≥1

Tn

(n− 1)!xn.

14 1. SERIE DI POTENZE

Ricordando che T0 = T1 = 0, abbiamo∑n≥1

Tn+1

n!xn =

∑n≥2

Tn

(n− 1)!xn−1 =

∑n≥2

Tn

n!nxn−1 = T′.

Invece ∑n≥1

Tn−1

(n− 1)!xn = x

∑n≥1

Tn−1

(n− 1)!xn−1 = xT

e ∑n≥1

Tn

(n− 1)!xn = x

∑n≥1

Tn

n!nxn−1 = xT′.

Dunque T′ = xT + xT′, quindi(1− x)T′ = xT,

da cuiT′ =

x

1− xT.

Il trucco per “risolvere” questa equazione e di fingere che sia un’ordinaria equazione differenziale:y′

y=

x

1− x= −1 +

11− x

da cuilog|y| = −x− log(1− x) + log|c|

e quindi

y = ce−x 11− x

.

La condizione iniziale dice che y(0) = 1, quindi c = 1. Il metodo in realta e simile a quello usatoper la successione dei numeri di Bell. Si mostra cioe che la derivata di E · (1− x) · T e zero. Diconseguenza

T =E(−x)1− x

.

Da questa possiamo ricavare esplicitamente T. Infatti

T =(∑

n

(−1)n

n!xn

)(∑n

xn

)e dunque

Tn = n!n∑

i=0

(−1)i

i!.

CAPITOLO 2

Campi finiti

2.1. Estensioni algebriche

Ricordiamo che un campo e un anello commutativo F con 1 6= 0 in cui ogni elemento nonnullo e invertibile. Diremo che un campo K e estensione di un campo F se F e un sottoanellodi K. Scriveremo, per abbreviare, K/F , anche se questa notazione non ha nulla a che fare coninsiemi quoziente.

Se K e un’estensione di F , ogni polinomio nell’indeterminata x a coefficienti in F puo essereconsiderato anche a coefficienti in K; per essere piu precisi, F [x] e un sottoanello di K[x].

Un’altra proprieta importante e che K puo essere considerato come spazio vettoriale su F ,quindi si possono applicare tutte le nozioni che conosciamo sugli spazi vettoriali.

Definizione 2.1.1. L’estensione K/F si dice finita se la dimensione di K come spaziovettoriale su F e finita. In tal caso questa dimensione si indica con [K : F ].

E talvolta importante considerare estensioni di estensioni. Vale un’importante proprieta.

Teorema 2.1.2. Sia K un’estensione di F e sia L un’estensione di K. Allora L/F e finitase e solo se L/K e K/F sono finite e, in tal caso, [L : F ] = [L : K][K : F ].

Dimostrazione. Supponiamo che L/K e K/F siano finite; allora esistono una base B ={l1, . . . , lm} di L come spazio vettoriale su K e una base C = {k1, . . . , kn} di K come spaziovettoriale su F . Dimostriamo che

D = { likj | 1 ≤ i ≤ m, 1 ≤ j ≤ n }

e una base di L come spazio vettoriale su F .(1) D e un insieme di generatori. Infatti, se l ∈ L, possiamo scrivere l =

∑mi=1 αili, con

α1, . . . , αm ∈ K, dal momento che B e una base di L/K. Siccome C e una base di K/F , ciascunki puo essere scritto come

αi =n∑

j=1

βijkj

con βij ∈ F . Ne segue che

l =m∑

i=1

αili =m∑

i=1

( n∑j=1

βijkj

)li =

∑i,j

βij likj .

(2) D e linearmente indipendente. Supponiamo che∑i,j

βij likj = 0

con βij ∈ F . Allora

0 =∑i,j

βij likj =m∑

i=1

( n∑j=1

βijkj

)li

15

16 2. CAMPI FINITI

e quindi, essendo B linearmente indipendente,n∑

j=1

βijkj = 0 (i = 1, 2, . . . ,m).

Siccome anche C e linearmente indipendente, abbiamo che

βij = 0

per ogni i e j.Viceversa, supponiamo che L/F sia finita. Allora esiste un insieme di generatori finito di L

come spazio vettoriale su F e, a maggior ragione, sara anche un insieme di generatori di L comespazio vettoriale su K. Per finire, K e un sottospazio vettoriale di L/F , quindi ha dimensionefinita. �

Definizione 2.1.3. Sia K un’estensione di F . Un elemento b ∈ K si dice algebrico suF se esiste un polinomio f ∈ F [x] non nullo tale che f(b) = 0. Un elemento b ∈ K si dicetrascendente su F se non e algebrico. Diciamo che l’estensione K/F e algebrica se ogni elementodi K e algebrico su F .

Come esempio classico,√

2 ∈ R e algebrico su Q, poiche e radice del polinomio x2 − 2. Unfamoso risultato di Lindemann e Weierstrass dice che π e trascendente su Q.

Teorema 2.1.4. Se K/F e finita, allora e algebrica.

Dimostrazione. Sia n = [K : F ] e sia b ∈ K. Allora gli elementi 1, b, . . . , bn sonolinearmente dipendenti (sono piu della dimensione) e percio esistono a0, a1, . . . , an ∈ F , nontutti nulli, tali che a0 · 1 + a1b + · · · + anbn = 0. Questo significa proprio che il polinomiof = a0 + a1x + · · ·+ anxn e non nullo e che f(b) = 0. �

Il viceversa non e vero, come vedremo piu avanti.Si pone un problema: dato un polinomio non nullo in F [x], e possibile trovare un’estensione

K/F dove il polinomio ammetta una radice? Ad esempio, il polinomio x2 + 1 ∈ R[x] non haradici, ma ne ha nell’estensione C.

Proprio come abbiamo ampliato i reali per ottenere i complessi, si puo risolvere il problemadi prima in generale.

Lemma 2.1.5. Sia b ∈ K algebrico su F ; allora l’insieme Ib = { f ∈ F [x] | f(b) = 0 } e unideale non nullo di F [x].

Dimostrazione. Chiaramente il polinomio nullo appartiene a Ib; se f, g ∈ Ib, abbiamo chevb(f + g) = vb(f) + vb(g) = 0 + 0, quindi f + g ∈ Ib. Se poi f ∈ Ib e g ∈ F [x], abbiamo chevb(fg) = vb(f)vb(g) = 0. �

Ricordiamo che ogni ideale di F [x] e principale, quindi esiste un unico polinomio monicofb ∈ Ib tale che Ib = fbF [x], cioe ogni polinomio in Ib e della forma fbg, per un opportunog ∈ F [x]. Questo polinomio e il polinomio monico di grado minimo in Ib e si chiama polinomiominimo di b.

Proposizione 2.1.6. Sia b ∈ K algebrico su F ; allora il polinomio minimo fb ∈ F [x] eirriducibile.

Dimostrazione. Se fb = gh, con g, h ∈ F [x], allora 0 = fb(b) = g(b)h(b), quindi g ∈ Ib

oppure h ∈ Ib. Nel primo caso, siccome fb ha grado minimo, dovremo avere che il grado di g none minore del grado di fb, quindi g e fb hanno lo stesso grado e h ha grado 0, cioe e invertibile.L’altro caso e analogo. �

2.1. ESTENSIONI ALGEBRICHE 17

Esercizio: dimostrare che, se g ∈ Ib e irriducibile e monico, allora e il polinomio minimo di b.Attenzione: occorre sempre dire qual e l’estensione che si sta considerando. Ad esempio, il

polinomio minimo di i 4√

2 ∈ C su Q e x4 + 2, mentre su R e x2 +√

2.Se consideriamo una famiglia di sottocampi del campo K, la loro intersezione e un sotto-

campo. Analogamente per sottoanelli. Di conseguenza i concetti di cui parleremo ora sono bendefiniti.

Definizione 2.1.7. Se b ∈ K, estensione di F , indichiamo con F [b] il minimo sottoanello diK che contenga sia F che b. Con F (b) indichiamo il minimo sottocampo di K che contiene siaF che b.

E ovvio che F [b] ⊆ F (b). Quando saranno uguali? Ci occorre una descrizione di F [b].Consideriamo l’omomorfismo di valutazione

vb : F [x] → K

f 7→ f(b)

e sia B la sua immagine. Allora B e un sottoanello di K che contiene sia F che b; dunque F [b] ⊆B. Ma un elemento di B si scrive come f(b), per un opportuno f ∈ F [x], cioe a0+a1b+· · ·+anbn

e questo elemento deve appartenere ad ogni sottoanello di K che contenga sia F che b. PercioB = F [b].

Proposizione 2.1.8. Se b e algebrico su F , allora F [b] e un campo. Se b e trascendente suF , allora F [b] e isomorfo a F [x].

Dimostrazione. Sia b algebrico. Il teorema di omomorfismo dice che l’immagine di vb eun anello isomorfo a F [x]/Ib, perche Ib e il nucleo di vb. Siccome Ib e l’ideale principale generatoda un elemento irriducibile, esso e massimale, quindi l’immagine di vb, che e proprio F [b] e uncampo.

Se invece b e trascendente, il nucleo di vb e l’ideale nullo, quindi vb e iniettivo. Ne segue cheF [b] e isomorfo a F [x]. �

Corollario 2.1.9. Se b e algebrico su F , allora F [b] = F (b).

Notiamo come la dimostrazione “astratta” permetta di evitare la verifica che ogni elementodi F [b] e invertibile. La stessa dimostrazione pero puo essere resa “algoritmica”: vogliamo trovareun metodo per calcolare gli inversi. Prendiamo dunque b ∈ K algebrico su F e il suo polinomiominimo fb. Un elemento di F [a] e della forma c = g(b), per un opportuno g ∈ F [x]. L’algoritmodella divisione in F [x] dice che esistono e sono unici q, r ∈ F [x] tali che

g = fbq + r, ∂(r) < ∂(fb).

Ne segue chec = g(b) = vb(g) = vb(fbq + r) = vb(fb)vb(q) + vb(r) = vb(r).

Percio c 6= 0 se e solo se r(b) 6= 0. Nel caso in cui c 6= 0 possiamo allora dire che mcd(fb, r) = 1,in quanto r 6= 0 ha grado minore del grado di fb che e irriducibile. Per il teorema di Bezout, chevale anche il F [x], esistono due polinomi s, t ∈ F [x] tali che

sr + tfb = 1.

Valutiamo questa identita in b:

1 = vb(1) = vb(sr + tfb) = vb(s)vb(r) + vb(t)vb(fb) = s(b)r(b).

Non solo abbiamo trovato l’inverso di c, cioe s(b); abbiamo anche visto che ogni elemento diF [b] si scrive come r(b), dove r ∈ F [x] e ∂(r) < ∂(fb). Questa scrittura e unica: infatti, ser1(b) = r2(b) con ∂(r1), ∂(r2) < ∂(fb), abbiamo che r1 − r2 ∈ Ib e ha grado minore di ∂(fb),quindi r1 − r2 = 0.

18 2. CAMPI FINITI

Teorema 2.1.10. Sia b ∈ K algebrico su F . Allora F [b] e il minimo sottocampo di K checontiene sia F che b. Inoltre

[F [b] : F ] = ∂(fb)cioe la dimensione di F [b] come spazio vettoriale su F e uguale al grado n del polinomio minimodi b su F e una base e data da {1, b, . . . , bn−1}.

Dimostrazione. Ci basta dimostrare l’asserzione sulla base. Abbiamo visto che ogni ele-mento di F [b] si scrive in modo unico come r(b), dove r ∈ F [x] e ∂(r) < ∂(f). Un polinomio rdi questo tipo e della forma a0 + a1x + · · ·+ an−1x

n−1 e quindi gli elementi di F [b] si scrivonoin modo unico come

a0 · 1 + a1b + · · ·+ an−1bn−1

e questo dice proprio che ogni elemento di F [b] si scrive in modo unico come combinazione linearea coefficienti in F di 1, b, . . . , bn−1. �

Ritorniamo allora al problema di trovare un’estensione opportuna di F in cui un certopolinomio f ∈ F [x] abbia radici. La costruzione sara iterativa; intanto, siccome e possibilescomporre f in fattori irriducibili, non e restrittivo supporre che f sia irriducibile. In questocaso l’ideale I = fF [x] e massimale in F [x] e quindi l’anello quoziente F [x]/I e un campo.Inoltre l’applicazione

α : F → F [x]/I

a 7→ [a]

e un omomorfismo iniettivo di anelli. Percio, invece di scrivere [a] possiamo scrivere a, identifican-do questi elementi. In tal modo K = F [x]/I diventa un’estensione di F . Poniamo b = [x] ∈ K.Abbiamo allora, scrivendo f = a0 + a1x + · · ·+ anxn,

vb(f) = a0 + a1b + · · ·+ anbn = [a0] + [a1]b + · · ·+ [an]bn

= [a0] + [a1][x] + · · ·+ [an][x]n = [a0 + a1x + · · ·+ anxn] = [0] = 0.

Il problema e risolto! Infatti K e proprio un’estensione di F in cui f ammette una radice.Possiamo allora scrivere f = (x − b)f1, dove f1 ∈ K[x] ha grado piu piccolo di f . Questo da ilvia alla procedura iterativa.

Teorema 2.1.11. Se f ∈ F [x] e monico e ha grado n > 0, esiste un’estensione K di F taleche:(1) f = (x− b1)(x− b2) . . . (x− bn) in K[x];(2) K = F [b1, b2, . . . , bn]Se L/F e un’altra estensione con le stesse proprieta, allora esiste un isomorfismo α : K → Ltale che α(a) = a, per ogni a ∈ F .

Non daremo la dimostrazione di questo teorema, che richiederebbe troppo tempo. L’estensio-ne cosı determinata, che e allora unica a meno di isomorfismi, si chiama un campo di riducibilitacompleta di f . Con F [b1, b2, . . . , bn], dove gli elementi bi ∈ K, intendiamo il minimo sottoanel-lo di K che contiene F ∪ {b1, . . . , bn}; e facile dimostrare per induzione che F [b1, b2, . . . , bn] eun sottocampo se gli elementi bi sono algebrici su F . Analogamente F (b1, . . . , bn) e il minimosottocampo di K che contiene F ∪ {b1, . . . , bn}.

C’e un’altra proprieta importante delle estensioni algebriche.

Teorema 2.1.12. Sia K/F un’estensione di campi. Se b, b1, b2 ∈ K sono algebrici su F ,allora b1 + b2, b1 − b2, b1b2 e −b sono algebrici su F ; se b 6= 0, anche b−1 e algebrico su F .

Dimostrazione. Consideriamo F (b1, b2); e ovvio dalla definizione che F (b1, b2) = F (b1)(b2).Siccome b2 e algebrico su F , esso e a maggior ragione algebrico su F (b1); quindi

[F (b1, b2) : F ] = [F (b1)(b2), F (b1)][F (b1) : F ]

2.2. CAMPI FINITI 19

e finita e quindi ogni elemento di F (b1, b2) e algebrico su F . Quindi lo sono b1 + b2, b1− b2, b1b2.Analogamente per −b e b−1. �

Corollario 2.1.13. Se K e un’estensione di F , allora l’insieme degli elementi di K chesono algebrici su F e un sottocampo di K.

Diamo senza dimostrazione un famoso teorema dovuto a Steinitz. Prima pero una definizio-ne: un campo K si dice algebricamente chiuso se ogni polinomio a coefficienti in K, di grado > 0,ammette una radice. Il cosiddetto teorema fondamentale dell’algebra dice che C e algebricamen-te chiuso. Un’estensione K di F si dice una chiusura algebrica di F se K e algebricamente chiusoe ogni elemento di K e algebrico su F .

Teorema 2.1.14. Ogni campo F ha una chiusura algebrica. Se K e L sono chiusurealgebriche di F , allora esiste un isomorfismo α : K → L tale che α(a) = a, per ogni a ∈ F .

Possiamo allora dire, usando gli ultimi due enunciati, che l’insieme Q dei numeri complessialgebrici su Q e una chiusura algebrica di Q. Dal momento che esistono numeri complessitrascendenti su Q, abbiamo Q 6= C. Chiaramente, invece, C e una chiusura algebrica di R,poiche ogni numero complesso e radice di un polinomio a coefficienti reali: infatti a + bi e radicedi x2 − 2ax + (a2 + b2).

2.2. Campi finiti

Ricordiamo la definizione di caratteristica di un anello A: esiste un unico omomorfismo dianelli χA : Z → A, definito da χA(n) = n1, multiplo secondo n di 1 ∈ A. Il nucleo di questoomomorfismo e un ideale di Z, quindi della forma kZ, dove k ≥ 0. La caratteristica di A e alloraquesto numero k. Se k e la caratteristica di A, ka = 0, per ogni a ∈ A.

Sappiamo che, se A e un dominio, la sua caratteristica e zero oppure un numero primo.In particolare questo vale per un campo. Se in piu sappiamo che il campo F e finito, la suacaratteristica deve essere un numero primo p: infatti l’omomorfismo χA non puo essere iniettivo,quindi kerχA 6= {0} = 0Z.

Proposizione 2.2.1. Se la caratteristica dell’anello commutativo A e un numero primo p,allora l’applicazione

Φ: A → A

a 7→ ap

e un omomorfismo di anelli.

Dimostrazione. Che Φ(1) = 1 e Φ(ab) = (ab)p = apbp = Φ(a)Φ(b) e chiaro. Inoltre per ilteorema del binomio

Φ(a + b) = (a + b)p =p∑

i=1

(p

i

)aibp−i.

Se 0 < i < p, abbiamo che (p

i

)=

p!i! (p− i)!

e divisibile per p, quindi(pi

)aibp−i = 0. Di conseguenza (a + b)p = ap + bp. �

Naturalmente allora anche Φ2 = Φ ◦ Φ, . . . , Φn+1 = Φn ◦ Φ, eccetera, sono omomorfismi.Un’altro fatto importante e che un anello commutativo di caratteristica k ha un sottoanello

isomorfo a Z/kZ, precisamente l’immagine di χA, che si chiama sottoanello primo di A; nel casoin cui k e un numero primo, questo e un sottocampo.

20 2. CAMPI FINITI

Teorema 2.2.2. Sia F un campo finito e sia p la sua caratteristica. Allora

|F | = pn

per un opportuno intero n ≥ 1.

Dimostrazione. Sia F0 il sottocampo primo di F ; allora F0∼= Z/pZ ha p elementi. La

dimensione di F come spazio vettoriale su F0 e finita, perche F stesso e un insieme di generatori;se questa dimensione e n = [F : F0], ogni elemento di F si scrive in modo unico come combina-zione lineare di n elementi a coefficienti in F0; il numero di tali combinazioni lineari e propriopn. �

Il piccolo teorema di Fermat ammette una generalizzazione.

Teorema 2.2.3. Sia F un campo con q elementi. Allora, per ogni a ∈ F , si ha aq = a.

Dimostrazione. L’insieme F \ {0} e, rispetto alla moltiplicazione, un gruppo con q − 1elementi. Percio aq−1 = 1, per ogni a ∈ F \ {0}. Di conseguenza aq = a e l’identita vale ancheper a = 0. �

Il teorema sull’unicita di un campo di riducibilita completa ha come conseguenza che duecampi con lo stesso numero (finito) di elementi sono isomorfi. Infatti questi due campi hanno lostesso sottocampo primo (per meglio dire sottocampi primi isomorfi, ma si possono identificare).Il polinomio xq − x ha coefficienti nel sottocampo primo; basta allora verificare che un campocon q elementi e il campo di riducibilita completa di xq − x sul sottocampo primo.

Sia dunque F = {a1, a2, . . . , aq} un campo con q elementi. Per quanto visto prima, ognielemento di F e radice del polinomio f = xq − x; dunque f si scrive come prodotto di fattori diprimo grado e certamente F = F0(a1, . . . , aq), dove F0 e il sottocampo primo.

Lemma 2.2.4. Sia F un campo di caratteristica p e sia q una potenza di p; allora il polinomioxq − x non ha radici di molteplicita ≥ 2.

Dimostrazione. Supponiamo che a ∈ F sia una radice ed eseguiamo la divisione di f =xq − x per x− a:

1 0 0 . . . 0 −1 0a a a2 . . . aq−2 aq−1 aq − a

1 a a2 . . . aq−2 aq−1 − 1 0Dunque il quoziente e

g = xq−1 + axq−2 + a2xq−3 + · · ·+ aq−2x + (aq−1 − 1)

e se valutiamo in a otteniamo

g(a) = qaq−1 − 1 = −1 6= 0,

dal momento che q e una potenza di p. Percio a non e una radice di g e abbiamo la tesi. �

Teorema 2.2.5. Se q = pn e potenza di un primo p, allora esiste, a meno di isomorfismi,un unico campo con q elementi.

Dimostrazione. Abbiamo gia osservato l’unicita. Per quanto riguarda l’esistenza, ci bastaconsiderare di nuovo il polinomio f = xq − x a coefficienti in Z/pZ. Sia K un campo diriducibilita completa di f , che sappiamo esistere. A priori non e detto che K abbia proprio qelementi; consideriamo dunque l’insieme F delle radici di f in K. Allora F e un sottocampodi K.

Infatti 1 = 1q ∈ F ; se poi a, b ∈ F , abbiamo

(a + b)q = (a + b)pn

= Φn(a + b) = Φn(a) + Φn(b) = a + b

2.2. CAMPI FINITI 21

e lo stesso ragionamento con la moltiplicazione prova che ab ∈ F . Inoltre (a−1)q = (aq)−1 = a−1,se a 6= 0. Per l’opposto abbiamo (−a)q = −aq = −a, se p e dispari; se invece p = 2, abbiamo−a = a, e non c’e altro da dimostrare.

Per il lemma precedente F ha q elementi, perche le sue radici in K sono tutte distinte e neha q per l’ipotesi che K e un campo di riducibilita completa per f . Ne segue allora che F = Kha q elementi. �

Il campo con q = pn elementi, unico a meno di isomorfismi, si denota con GF(q). Inparticolare GF(p) = Z/pZ.

Come si costruisce esplicitamente un campo con q = pn elementi? Ad esempio, supponiamodi voler determinare GF(9). Secondo il teorema precedente, dobbiamo calcolare un campo diriducibilita completa di x9 − x su GF(3). Prima di tutto scriviamolo come prodotto di fattoriirriducibili:

x9 − x = x(x− 1)(x− 2)(x2 + 1)(x4 + 1).

Se esaminiamo g = x2 + 1, notiamo che e irriducibile in GF(3) e quindi l’anello quozienteGF(3)[x]/g GF(3)[x] e un campo che ha dimensione 2 su GF(3) e percio e GF(9). La sua basee {1, b}, dove b ha la proprieta che b2 = −1; quindi gli elementi si scrivono come α + βb, conl’addizione per componenti e la moltiplicazione

(α + βb)(γ + δb) = αγ + αδb + βγb + βδb2 = (αγ − βδ) + (αδ + βγ)b.

Le radici di x2 + 1 sono b = 0 + 1b e −b = 0 + 2b. Cerchiamo le radici di x4 + 1, che sappiamodevono esistere. Si ha

x4 + 1 = x4 − b2 = (x2 − b)(x2 + b).

Affinche α + βb sia radice di x2 − b occorre che

α2 − β2 = 0 e 2αβ = 1.

Abbiamo quindi le soluzioni 1 + 2b e 2 + b. Si lascia come esercizio la verifica che gli altri dueelementi 1 + b e 2 + 2b sono proprio le radici di x2 + b.

Se prendiamo invece come polinomio irriducibile x2−x−1 e indichiamo con c una sua radice,gli elementi di GF(9) si scrivono come α + βc con moltiplicazione

(α + βc)(γ + δc) = αγ + αδc + βγc + βδc2 = (αγ + βδ) + (αδ + βγ + βδ)c,

perche c soddisfa l’identita c2 = 1+c. Questa scelta puo essere piu conveniente perche le potenzedi c sono tutti gli elementi non nulli di GF(9). Infatti

c2 = 1 + c = 1 + c,

c3 = c + c2 = 1 + 2c,

c4 = c + 2c2 = 2,

c5 = 2c = 2c,

c6 = 2c2 = 2 + 2c,

c7 = 2c + 2c2 = 2 + c,

c8 = 2c + c2 = 1.

Esercizio: determinare l’isomorfismo fra i campi costruiti nei due modi.Non occorre costruire passo passo i campi GF(pn); infatti basta considerare un unico poli-

nomio f ∈ GF(p)[x] che abbia grado n e sia irriducibile. Un tale polinomio esiste sempre ed edeterminabile in tempo finito: basta scrivere n = i + j in tutti i modi possibili con i, j ≥ 1 ecalcolare tutti i prodotti dei polinomi di grado i e j in GF(p)[x]; quelli di grado n che non siottengono cosı sono certamente irriducibili.

22 2. CAMPI FINITI

Vogliamo come altro esempio determinare GF(8). Ci serve un polinomio f ∈ GF(2)[x] digrado 3 e irriducibile. Una scelta possibile e f = 1 + x + x3 e quindi GF(8) ha come base suGF(2) gli elementi 1, b e b2, dove 1 + b + b3 = 0. Dunque la moltiplicazione e

(α1 + β1b + γ1b2)(α2 + β2b + γ2b

2)

= (α1α2 +β1γ2 +γ1β2)+(α1β2 +β1α2 +β1γ2 +γ1β2 +γ1γ2)b+(α1γ2 +β1β2 +γ1α2 +γ1γ2)b2

2.3. Chiusura algebrica

Il teorema di Steinitz dice che ogni campo ammette una chiusura algebrica. La costruzionerigorosa della chiusura algebrica GF(p∞) di GF(p) richiederebbe troppo tempo, non perche siaintrinsecamente difficile, quanto perche coinvolge concetti abbastanza delicati.

Tuttavia non e necessario, per molti scopi, considerare la chiusura algebrica. Quello chebasta sapere e come costruire, dato un numero finito di polinomi in GF(pn)[x], un campo che necontenga tutte le radici. Ovviamente ci basterebbe considerare un solo polinomio f , il prodottodi quelli dati, e costruirne il campo di riducibilita completa.

Il problema e gia risolto se nella decomposizione di f non compaiono fattori di grado > 1.Supponiamo allora che si trovi un fattore g di grado > 1.(1) F0 = GF(pn);(2) F1 = F1[x]/gF1[x] e un campo in cui g ha una radice;(3) si decompone f in fattori irriducibili in F1[x];(4) se esiste ancora un fattore irriducibile di grado > 1 si eseguono di nuovo i passi precedenti

ottenendo via via campi F2, F3, . . . , Fl, fino a che non risultano piu fattori di grado > 1.Il procedimento ha ovviamente termine. In modo analogo si potrebbe procedere per costruire

la chiusura algebrica di GF(p).(1) F0 = GF(p);(2) si prende un polinomio irriducibile f1 ∈ F0[x] di grado minimo > 1;(3) F1 = F0[x]/fF0[x] e un’estensione di F0 in cui f1 ha una radice;(4) si prende un polinomio irriducibile f2 ∈ F1[x] di grado minimo > 1;(5) . . .

Il procedimento va ripetuto all’infinito: infatti nessun campo finito puo essere algebricamentechiuso. La dimostrazione di questo fatto e analoga alla prova dell’infinita dei numeri primi.

Se F = {a1, . . . , aq} e un campo finito, si considera il polinomio

f = (x− a1)(x− a2) . . . (x− aq) + 1.

Allora nessun elemento di F e radice di f e quindi F non e algebricamente chiuso.

CAPITOLO 3

Curve algebriche

3.1. Polinomi in piu indeterminate e curve

Se A e un anello commutativo, possiamo costruire l’anello dei polinomi in una indeterminataA[x]. A partire da questo possiamo ancora costruire l’anello dei polinomi in una indeterminata,chiamiamola questa volta y. Gli elementi di questo nuovo anello sono allora le espressioni

f0 + f1y + f2y2 + · · ·+ fnyn,

dove f0, f1, . . . , fn ∈ A[x]. Un modo diverso e piu informale di presentare questo anello e diconsiderare le combinazioni lineari a coefficienti in A dei monomi xiyj al variare di i e j neinumeri naturali. La moltiplicazione si esegue usando le proprieta di anello e la commutativita.

Ovviamente il procedimento si puo ripetere induttivamente:

A[x1, x2] = A[x1][x2], A[x1, x2, . . . , xn−1, xn] = A[x1, x2, . . . , xn−1][xn].

Chiameremo A[x1, x2, . . . , xn−1, xn] anello dei polinomi in n indeterminate a coefficienti in A.Anche questo e l’insieme delle combinazioni lineari a coefficienti in A dei monomi xi1

1 xi22 . . . xin

n .Il grado totale di un monomio e la somma degli esponenti; il grado totale di un polinomio eil massimo dei gradi totali dei monomi con coefficienti non nulli. Il grado del polinomio nulloe −∞.

Come per l’anello dei polinomi in una indeterminata vale una proprieta importante cheriguarda la sostituzione.

Proposizione 3.1.1. Se A e un sottoanello dell’anello commutativo B e b1, b2, . . . , bn ∈ B,allora esiste un unico omomorfismo di anelli

vb1,b2,...,bn : A[x1, x2, . . . , xn] → B

tale chevb1,b2,...,bn

(xi) = bi (i = 1, 2, . . . , n)e vb1,b2,...,bn(a) = a per ogni a ∈ A.

Non dimostreremo il teorema seguente, che tuttavia e intuitivamente plausibile.

Teorema 3.1.2. Se F e un campo, ogni polinomio non costante in F [x1, x2, . . . , xn] puoessere scritto in modo essenzialmente unico come prodotto di polinomi irriducibili.

3.2. Curve algebriche

Se F e un campo e n > 0 denoteremo con Fn l’insieme delle n-uple di elementi di F ; questoe lo spazio affine di dimensione n su F . Di particolare importanza e il caso di n = 2, per il qualeparleremo del piano affine su F .

Definizione 3.2.1. Dato un polinomio non nullo f ∈ F [x, y], la curva algebrica definita daf e l’insieme

C(f) = { (a, b) ∈ F 2 | f(a, b) = 0 }.Il grado totale di f si dice anche grado di C(f). Una curva algebrica di grado due e una conica,una di grado tre e una cubica. Nel caso in cui il grado totale di f sia 1, C(f) e una retta.

23

24 3. CURVE ALGEBRICHE

Useremo la solita terminologia geometrica: gli elementi del piano affine sono chiamati punti ;si parla di retta o curva passante per un punto, eccetera. Cerchiamo allora di stabilire quantipunti possono avere in comune una curva algebrica e una retta. Il caso di due rette e facile:possono essere coincidenti, avere in comune un punto o nessuno; in questo caso si dirannoparallele.

Consideriamo ora una retta C(αx + βy + γ). Esiste un altro modo di scriverne i punti: se(a, b) appartiene alla retta, avremo γ = −αa − βb. Quindi i punti della retta sono tutti e soliquelli della forma

(a + βt, b− αt)al variare di t ∈ F (esercizio). Chiameremo x = a + λt, y = b + µt le equazioni parametrichedi una retta. Dobbiamo ovviamente avere λ e µ non entrambi nulli. Dalla forma parametricaotteniamo anche quella “polinomiale” come µx− λy + (λb− µa).

Sia ora data una curva C(f). Un punto in comune tra curva e retta dovra allora essere dellaforma (a + λt, b + µt) con

f(a + λt, b + µt) = 0.

L’espressione f(a + λt, b + µt) e un polinomio in t che ha grado non maggiore del grado totaledi f . Ci sono due casi: il primo e quando esso e non nullo, in cui la retta e la curva hanno almassimo n punti in comune, dove n e il grado di f ; il secondo e quando f(a + λt, b + µt) e ilpolinomio nullo.

Questo caso succede se e solo se il polinomio µx − λy + (λb − µa) e un divisore di f .Distinguiamo anche qui due casi. Se λ 6= 0, possiamo scrivere la retta come C(y − mx − q).Consideriamo poi A = F [x] e in A[y] eseguiamo la divisione di f per y − (mx + q); questo epossibile perche y − (mx + q) e monico. Possiamo allora scrivere

f = (y − (mx + q))g + r

dove r ∈ A, cioe e un polinomio nella sola x. Il fatto che f(x, mx + q) = 0 dice che r = 0.Nel caso in cui λ = 0, la retta puo essere scritta come x − a; se f(a, y) = 0, abbiamo che

x− c e un divisore di f (esercizio).Quando tutti i punti di una retta fanno parte anche di una curva data, diremo che la retta

e una componente della curva.

Proposizione 3.2.2. Una curva di grado n e una retta che non sia una sua componentepossono avere al massimo n punti in comune.

Saremo interessati principalmente a curve di grado > 1 che siano definite da un polinomioirriducibile. In questo caso una retta non puo essere una componente della curva. Diremo allorache la curva e F -irriducibile.

Analizziamo un esempio molto importante, la curva in R2 definita da f = x3−x2 +y2. None difficile dimostrare che questo polinomio e irriducibile (esercizio). Il grafico di questa curva eillustrato nella figura 1.

Se consideriamo una retta passante per un punto della curva diverso dall’origine, questainterseca la curva in vari punti. Prendiamo ad esempio una retta x = 1 + λt, y = µt:

f(1 + λt, µt) = t(λ3t2 + (2λ2 + µ2)t + λ).

Questo polinomio e di grado 2 se λ = 0 e, in tal caso, ha la radice zero di molteplicita 2.Altrimenti ha grado 3 e non ha radici multiple se non quando µ = 0; in effetti 0 non e radice delfattore di grado 2, il quale ha discriminante µ2(4λ2 + µ2).

Diverso e il caso delle rette passanti per l’origine, che hanno equazioni x = λt, y = µt. Si hainfatti

f(λt, µt) = t2(λ3t + (µ2 − λ2))che ha 0 come radice almeno doppia. E addirittura tripla quando µ = ±λ. Il grado si abbassaquando λ = 0.

3.2. CURVE ALGEBRICHE 25

Figura 1. Folium di Cartesio

Dovrebbe essere evidente il motivo di questo comportamento: la curva “passa due volte”per l’origine. Le rette x + y e x− y sono “tangenti” ai due rami della curva. Nel punto (1, 0) latangente e la retta verticale, per la quale la radice 0 e multipla.

Definizione 3.2.3. Un punto (a, b) di una curva C(f) si dice multiplo o singolare se, perogni retta x = a + λt, y = b + µt passante per (a, b), il polinomio f(a + λt, b + µt) ha zero comeradice multipla.

Esiste una semplice caratterizzazione dei punti singolari. Dato un polinomio f ∈ F [x],definiamo la sua derivata tramite l’usuale regola nxn−1: percio, se f = a0 + a1x + · · ·+ anxn, laderivata e f ′ = a1 + 2a2x + · · · + nanxn. Le usuali regole di derivazione sono valide. Se invecef ∈ F [x, y], possiamo definirne le derivate parziali eseguendo le derivate rispetto a x e a y. Leindicheremo con D1f e D2f rispettivamente.

Teorema 3.2.4. Un punto (a, b) della curva C(f) e multiplo se e solo se D1f(a, b) = 0 eD2f(a, b) = 0.

Dimostrazione. Proviamo a valutare il monomio g = xiyj in (a + λt, b + µt): otteniamo

g(a + λt, b + µt) = aibj + iai−1bjλt + jaibj−1µt + (. . . )t2.

Diventa allora evidente che

f(a + λt, b + µt) = f(a, b) +(λD1f(a, b) + µD2f(a, b)

)t + (. . . )t2.

Se vogliamo che la radice 0 sia doppia per ogni retta, dobbiamo necessariamente avere D1f(a, b) =D2f(a, b) = 0. Ovviamente la condizione e anche sufficiente. �

26 3. CURVE ALGEBRICHE

Possiamo anche definire la molteplicita di un punto: ne daremo solo una versione operativa,che si puo giustificare proseguendo nello sviluppo indicato nella dimostrazione precedente. Unpunto (a, b) della curva C(f) si dice di molteplicita m se tutte le derivate parziali di f finoall’ordine m si annullano in (a, b), ma una di ordine m + 1 non si annulla.

La verifica e facile quando il punto da considerare e l’origine (0, 0): essa e un punto m-uploper C(f) se in f non compaiono monomi di grado totale minore di m.

Ad esempio, la curva di f = x5 − y(x2 − y2)(x2 − 4y2) ha un punto quadruplo nell’origine.Il suo grafico nel caso in cui F = R e indicato nella figura 2. Nella figura 3 e disegnato il graficodella curva di x5 − y(x2 − y2)2.

Figura 2. Curva con punto quadruplo x5 − y(x2 − y2)(x2 − 4y2)

Figura 3. Curva con punto quadruplo x5 − y(x2 − y2)2

Se un punto (a, b) della curva C(f) e semplice, esiste sempre una retta x = a+λt, y = b+µttale che 0 sia una radice doppia del polinomio f(a + λt, b + µt). Infatti basta scrivere cheλD1f(a, b) + µD2f(a, b) = 0 e una soluzione (ed e l’unica come retta) si trova.

Definizione 3.2.5. Una retta di equazioni parametriche x = a + λt, y = b + µt e tangentealla curva C(f) nel punto m-uplo (a, b) se 0 e radice di molteplicita almeno m + 1 del polinomiof(a + λt, b + µt).

Non sempre e possibile invece determinare le tangenti in un punto multiplo: ad esempio,se F = GF(3), la cubica x3 + x2 + xy + 2y2 ha un punto doppio nell’origine; se consideriamouna retta x = λt, y = µt, il polinomio che ne risulta e λ3t3 + (λ2 + λµ + 2µ2)t2 e non esistonoλ, µ ∈ GF(3), non entrambi nulli, tali che λ2 + λµ + 2µ2 = 0. La situazione ovviamente non sipresenta in un campo algebricamente chiuso.

Come ogni polinomio a coefficienti in F si puo considerare come a coefficienti in ogniestensione di F , cosı per le curve.

Definizione 3.2.6. Una curva C(f) sul campo F si dice irriducibile se non esiste un’esten-sione algebrica K di F in cui f sia un polinomio irriducibile. Diremo che la curva e non-singolarese non esiste un’estensione algebrica K di F in cui la curva C(f) ammette punti multipli.

3.3. COORDINATE OMOGENEE 27

E chiaro che come estensione si puo prendere la chiusura algebrica di F ed eseguire i calcoliin essa. Ad esempio, la curva x2 + y2 sarebbe irriducibile in R, ma non lo e, visto che neicomplessi possiamo scrivere x2 + y2 = (x + iy)(x− iy).

Come esempio, determiniamo quali curve f = x3 +αx+β−y2 sono non-singolari. AbbiamoD1f = 3x2 +α e D2f = −2y. Supponiamo che la caratteristica di F sia diversa da 2 e da 3. Unpunto multiplo deve avere allora la forma (t, 0), dove{

t3 + αt + β = 03t2 + α = 0

Affinche il sistema ammetta soluzione in una opportuna estensione algebrica di F e necessario esufficiente che 4a3 + 27b3 = 0, condizione che vediamo dipendere solo da F .

3.3. Coordinate omogenee

Consideriamo di nuovo la cubica f = x3 + αx + β − y2, che avra particolare importanza nelseguito. Se la intersechiamo con una retta x = a + λt, y = b + µt, otteniamo

f(a + λt, b + µt) = λ3t3 + (3λ2a− µ2)t2 + (3λa2 + λα− 2µb)t + a3 + αa + β − b2.

Vediamo allora che le rette con λ 6= 0 incontrano la curva in tre punti (con le loro molteplicita,ovviamente). Invece quelle con λ = 0 la incontrano al piu due punti. Questa asimmetria e pocopiacevole, ma e nella natura delle cose.

Ancora piu spiacevole e il caso della cubica x2y − y + 1, il cui grafico e nella figura 4; adesempio, le rette parallele all’asse y la incontrano solo in un punto.

Figura 4. Curva x3 − (y − 1)x2 + (y − 1)

E possibile trovare qualcosa in comune fra questa cubica e il Folium di Cartesio? La risposta eche queste due curve sono la stessa curva, da due punti di vista diversi. Per vedere la somiglianza,pero, e necessario introdurre il piano proiettivo.

Definizione 3.3.1. Il piano proiettivo sul campo F e l’insieme P 2(F ) cosı determinato:

28 3. CURVE ALGEBRICHE

(1) nell’insieme F 3 \ {(0, 0, 0)} delle terne ordinate di elementi di F esclusa (0, 0, 0) si definiscela relazione di equivalenza

(a, b, c) ∼ (a′, b′, c′) se e solo se esiste ρ ∈ F , ρ 6= 0 con (a′, b′, c′) = (ρa, ρb, ρc).

(2) P 2(F ) = (F 3 \ {(0, 0, 0)})/∼.

La classe di equivalenza di (a, b, c) sara indicata con (a : b : c), un punto di P 2(F ).

E chiaro come generalizzare il tutto a “spazi” di dimensione maggiore, ma non lo useremo.Piuttosto cerchiamo di scoprire perche P 2(F ) si chiama “piano”. Abbiamo punti e vogliamodefinire le “rette”.

Definizione 3.3.2. Dati α, β, γ ∈ F non tutti nulli, la retta αx1 +βx2 + γx3 e l’insieme deipunti (a : b : c) ∈ P 2(F ) tali che

αa + βb + γc = 0.

Notiamo che questa e una buona definizione, perche non dipende dalla particolare terna cherappresenta il punto. Due rette sono uguali se hanno gli stessi punti.

Proposizione 3.3.3. Due rette αx1 + βx2 + γx3 e α′x1 + β′x2 + γ′x3 sono uguali se e solose esiste ρ ∈ F , ρ 6= 0, tale che

α′ = ρα, β′ = ρβ, γ′ = ργ.

Dimostrazione. Il punto (a : b : c) appartiene alla retta αx1 + βx2 + γx3 se e solo se ilvettore [a b c]T e soluzione del sistema

[α β γ

] xyz

= 0.

Il sottospazio delle soluzioni di questo sistema ha dimensione 2, perche la matrice [α β γ] harango 1. Dire che le due rette hanno gli stessi punti equivale allora a dire che il sistema[

α β γα′ β′ γ′

]xyz

= 0.

ha come insieme delle soluzioni un sottospazio di dimensione 2, cioe che la matrice[α β γα′ β′ γ′

]ha rango 1. Completare la dimostrazione per esercizio. �

Proposizione 3.3.4. Due rette distinte in P 2(F ) hanno esattamente un punto in comune.

Dimostrazione. Dire che le rette sono distinte significa che, usando le stesse notazioni diprima, la matrice [

α β γα′ β′ γ′

]ha rango 2. Il sistema associato ha allora come spazio delle soluzioni un sottospazio di dimen-sione 1, che quindi ha una base formata da un vettore non nullo [a b c]T . Il punto (a : b : c) eallora l’unico punto comune alle due rette. �

Proposizione 3.3.5. Dati due punti distinti di P 2(F ), esiste una ed una sola retta chepassa per i due punti.

3.3. COORDINATE OMOGENEE 29

Dimostrazione. Se i punti sono (a : b : c) e (a′ : b′ : c′), una retta per essi deve essere dellaforma αx1 + βx2 + γx3. Dunque [α β γ]T deve essere soluzione del sistema che ha come matriceassociata [

a b ca′ b′ c′

]che ha, per ipotesi, rango 2. L’insieme delle soluzioni e allora un sottospazio di dimensione 1,cio che determina una retta. �

Il fatto che parliamo di punti e rette dovrebbe indurci a pensare di trattare oggetti che hannoqualcosa a che fare con gli enti geometrici tradizionali, almeno nel caso in cui F = R.

Se consideriamo i punti (a : b : c) ∈ P 2(F ) tali che c 6= 0, abbiamo (a : b : c) = (a/c : b/c : 1),quindi possiamo definire un’applicazione j : F 2 → P 2(F ) con l’assegnazione (a, b) 7→ (a : b : 1) equesta e iniettiva. Decidiamo di chiamare propri i punti di P 2(F ) per i quali c 6= 0 e improprigli altri. Identificheremo i punti propri con i corrispondenti punti di F 2 tramite j.

Supponiamo sia data una retta αx1 + βx2 + γx3 in P 2(F ). I punti propri della retta sonoquelli (a : b : 1) per i quali αa + βb + γ = 0, cioe costituiscono una retta di F 2. Su ogni rettaαx1 + βx2 + γx3 in cui uno fra α e β e non nullo esiste uno ed un solo punto improprio.

Sappiamo poi che la condizione affinche due rette del piano affine αx+βy+γ e α′x+β′y+γ′

siano parallele e che il sistema che ha come matrice completa[α β γα′ β′ γ′

]non abbia soluzioni, cioe, per il teorema di Rouche-Capelli, che la matrice completa abbia rango 2,mentre quella dei coefficienti abbia rango 1. E facile verificare allora che le rette del pianoproiettivo αx1+βx2+γx3 e α′x1+β′x2+γ′x3 hanno in comune uno ed un solo punto improprio.

Quello che succede e allora la realizzazione dell’intuizione di Desargues: abbiamo aggiuntoad ogni retta un punto improprio, in modo che due rette parallele abbiano in comune esattamenteil loro punto improprio. La totalita dei punti impropri forma una retta (del piano proiettivo),che ha come polinomio x3.

Mettiamoci ora nello spazio (affine) tridimensionale. Sia C il punto di coordinate (0, 0, 1) esia π il piano di equazione y = −1. Associamo ai punti di π un punto del piano xy nel modoseguente:

(1) dato il punto P di coordinate (ξ,−1, η) si prende la retta rP che passa per questo punto eC;

(2) si associa a P il punto P di intersezione della retta rP con il piano xy.

E facile vedere che le coordinate del punto P sono(ξ

η − 1,

1η − 1

, 0)

.

Notiamo che non ad ogni punto di π corrisponde un punto del piano xy, infatti i punti dellaretta y = −1, z = 1 non hanno un corrispondente. Possiamo anche scrivere la corrispondenza“inversa”: al punto Q di coordinate (x, y, 0) associamo il punto Q di coordinate(

x

y,−1,

1y

+ 1)

.

Non hanno corrispondente solo i punti della retta y = 0, z = 0. Se escludiamo i punti che nonhanno corrispondente, le due applicazioni sono una l’inversa dell’altra, cioe ˜P = P e ˜Q = Q.

Abbiamo ottenuto una corrispondenza fra punti di due piani. Un sistema di coordinatesul piano π e dato dalle coordinate “prima” e “terza”. Vogliamo vedere quali punti di π sono

30 3. CURVE ALGEBRICHE

mandati in punti del Folium di Cartesio sul piano xy; saranno quelli di coordinate (locali) (ξ, η)per i quali (

ξ

η − 1

)3

−(

ξ

η − 1

)2

+(

1η − 1

)2

= 0

cioe quelli per cui ξ3 − (η− 1)ξ2 + (η− 1) = 0. L’immagine del Folium di Cartesio sul piano π eproprio la cubica che abbiamo descritto nella figura 4.

Proviamo a estendere la corrispondenza a una fra piani proiettivi. Al punto P di coordi-nate (a : b : c) associamo il punto P di coordinate (a : c : b − c). Abbiamo in altre paroleun’applicazione

Φ: P 2(F ) → P 2(F )(a : b : c) 7→ (a : c : b− c)

la cui inversa e l’applicazione

Ψ: P 2(F ) → P 2(F )(a : b : c) 7→ (a : b + c : b)

Ora le due applicazioni sono definite ovunque e sono una l’inversa dell’altra. Sui punti propricoincidono con le funzioni definite parzialmente di cui sopra; in effetti un punto della rettapropria y − 1, cioe un punto della forma (a : 1 : 1) ha come corrispondente tramite Φ il punto(a : 1 : 0) che e un punto improprio. Analogamente un punto (a : 0 : 1) ha come corrispondentetramite Ψ il punto (a : 1 : 0), che e improprio.

Possiamo anche scrivere le due applicazioni per mezzo di matrici:1 0 00 0 10 1 −1

abc

=

ac

b− c

,

1 0 00 1 10 1 0

abc

=

ab + c

b

.

Le due matrici sono precisamente una inversa dell’altra.Se abbiamo una matrice 3×3, chiamiamola A, possiamo associare ad essa una trasformazione

del piano proiettivo, purche A sia non-singolare; infatti, in tal caso, Av 6= 0 se v 6= 0. Al vettorev = [a b c]T possiamo associare il punto v = (a : b : c); questo modo di procedere definisceeffettivamente un’applicazione A : P 2(F ) → P 2(F ). Infatti, se u = v, avremo u = ρv e quindi

Au = A(ρv) = ρ(Av).

PercioA(u) = Au = ρ(Av) = Av = A(v).

L’applicazione A e biiettiva, perche la sua inversa e A−1. Se poi B = ρA, per ρ ∈ F , ρ 6= 0,abbiamo che B = A.

Definizione 3.3.6. Una proiettivita del piano proiettivo su F e un’applicazione del tipo A,dove A e una matrice 3× 3 non-singolare. L’insieme delle proiettivita del piano proiettivo e ungruppo rispetto all’operazione di composizione, denotato con PGL(2, F ).

Come esercizio, cerchiamo di studiare meglio il gruppo delle proiettivita. Partiamo dalgruppo GL(3, F ) delle matrici 3× 3 non-singolari. Le matrici scalari

Sρ =

ρ 0 00 ρ 00 0 ρ

con ρ 6= 0 formano un sottogruppo normale H. Sappiamo che ρA = SρA, quindi abbiamoproprio che

PGL(2, F ) = GL(3, F )/H.

Esercizio: determinare l’ordine dei gruppi PGL(2, F ) quando F e il campo GF(2), GF(4), GF(3)e GF(9).

3.3. COORDINATE OMOGENEE 31

Vogliamo studiare anche i punti uniti di una proiettivita: un punto v e unito per A quandov = A(v). La condizione necessaria e sufficiente e che esista uno scalare non nullo ρ tale che

Av = ρv,

cioe che ρ sia un autovalore di A e che v ne sia un autovettore.Supponiamo che ρ sia un autovalore di A di molteplicita geometrica 2; quindi esistono due

autovettori u e v relativi a ρ linearmente indipendenti. La retta per i due punti u e v consistedei punti della forma ˜λu + µv, dove λ e µ sono scalari non entrambi nulli. I vettori λu + µvsono allora autovettori relativi a ρ, quindi sono tutti punti uniti.

Il linguaggio dei vettori permette di scrivere facilmente la retta passante per due punti.Infatti una retta r e data dal suo polinomio αx1 +βx2 + γx3. Sia allora a il vettore riga [α β γ].Di nuovo il vettore riga determina la retta a meno di multipli scalari non nulli. Il punto vappartiene a r se e solo se av = 0. Una retta e determinata da due suoi punti distinti: infatti, seu e v appartengono alla retta r, ogni vettore della forma λu+µv (con λ e µ non entrambi nulli)definisce un punto della retta r. Viceversa, dato w tale che w ∈ r, abbiamo che u,v,w ∈ N(a).Ma lo spazio nullo di a ha dimensione 2, quindi i tre vettori sono linearmente dipendenti, cosiccheesistono λ, µ, ν non tutti nulli con

λu + µv + νw = 0.

Ora necessariamente ν 6= 0, visto che u e v sono linearmente indipendenti, quindi possiamoscrivere

w = (−λ/ν)u + (−µ/ν)v.

Dunque la retta per due punti distinti u e v e definita da un qualunque vettore riga non nulloa che appartiene allo spazio nullo sinistro della matrice [u v]. Inoltre un punto appartiene allaretta se e solo se il vettore che lo definisce e combinazione lineare di due vettori che rappresentanopunti distinti della retta.

Sia ora data una proiettivita A e siano u e v punti distinti. Vogliamo vedere che un puntow appartiene alla retta r per u e v se e solo se A(w) appartiene alla retta per A(u) e A(v).

Se w appartiene alla retta r per u e v, allora w = λu+µv. Allora Aw = λAu+µAv, comevolevamo. Il viceversa e analogo, usando A−1.

Ci interessa scoprire qual e il vettore riga che definisce la retta trasformata. Se a e il vettoreriga della retta r e b quello della retta trasformata, dobbiamo avere

bAu = 0 = bAv.

Dunque bA e un vettore riga non nullo nello spazio nullo sinistro della matrice [u v] e quindi eun multiplo scalare di a. Ne segue che possiamo anche prendere bA = a, cioe che b = aA−1.

Proposizione 3.3.7. Una proiettivita trasforma rette in rette e conserva l’incidenza.

Dimostrazione. La prima parte e gia fatta: l’immagine diretta tramite A di una retta euna retta. La seconda parte dice che, se due rette hanno in comune un punto, le loro immaginidirette hanno in comune l’immagine di quello stesso punto.

Infatti se v appartiene alle rette definite dai vettori riga a e b, abbiamo av = 0 e bv = 0.Ma allora

aA−1Av = av = 0

e analogamente per b. �

Vogliamo stabilire se in una proiettivita A esista una retta unita, cioe una retta r tale cheA(v) ∈ r, per ogni v ∈ r. Cio ovviamente significa che aA−1 = ρa, per quanto visto prima, doveil vettore riga a determina r. Prendendo le trasposte la cosa diventa chiara:

aA−1 = ρa ⇐⇒ a = ρaA ⇐⇒ AT aT = ρ−1aT ,

32 3. CURVE ALGEBRICHE

cioe aT e un autovettore per AT . Se il campo F e algebricamente chiuso, allora, ogni proiettivitaammette un punto unito e una retta unita.

Definizione 3.3.8. Una affinita del piano proiettivo su F e una proiettivita A tale che laretta impropria sia unita.

In altre parole A e un’affinita se e solo se l’immagine di tutti i punti impropri (a : b : 0) eancora un punto improprio. In particolare cio deve valere per i punti e1 e e2. La condizionesulla matrice A = [aij ] e dunque a31 = a32 = 0. Percio a33 6= 0, altrimenti A sarebbe singolare.Possiamo percio prendere a33 = 1. Il punto di coordinate (a : b : 1) viene allora mandato inquello definito dal vettorea11 a12 a13

a21 a22 a23

0 0 1

ab1

=

a11a + a12b + a13

a21a + a22b + a23

1

e quindi un’affinita e cio a cui siamo abituati nel piano affine.

3.4. Polinomi omogenei

Come le rette affini possono essere viste come rette del piano proiettivo private del puntoimproprio, anche le curve algebriche affini possono essere viste come curve del piano proiettivoprivate di punti impropri. Ma quali?

Ad esempio, la cubica della figura 4 ha tre asintoti: due verticali, di equazioni x− 1 e x + 1rispettivamente, e uno obliquo, di equazione x − y + 1. Sembra ragionevole dire che la cubicapassa per i punti impropri di queste rette, che hanno coordinate (0 : 1 : 0) quello delle prime duee (1 : 1 : 0) per la terza. Di piu: il fatto che queste rette siano asintoti dice intuitivamente cheesse sono tangenti alla cubica nei punti impropri. Per il punto (0 : 1 : 0) passano due tangenti,infatti questo punto e l’immagine del punto doppio del Folium di Cartesio. La retta impropriaallora ha tre punti in comune con la cubica: due coincidenti (il punto doppio) e uno semplice.

Prendiamo il Folium di Cartesio: le rette che lo incontrano in due soli punti sono le retteparallele all’asse delle ordinate; sembra ragionevole assumere che il punto improprio da aggiun-gere sia allora (0 : 1 : 0), che e il punto improprio di queste rette. Infatti le rette di quel tipohanno la forma x + γz.

Come si passa da una retta nel piano affine a quella corrispondente nel piano proiettivo? Sela prima e definita dal polinomio αx + βy + γ, la seconda e definita da αx + βy + γz. Abbiamosemplicemente reso omogeneo il polinomio. Cerchiamo di dare una definizione piu precisa.

Definizione 3.4.1. Un polinomio f ∈ F [x1, . . . , xn] e omogeneo se tutti i monomi checompaiono con coefficiente diverso da zero in f hanno lo stesso grado totale. Per convenzione ilpolinomio nullo e considerato omogeneo di qualunque grado (questo serve per rendere l’insiemedei polinomi omogenei di grado n uno spazio vettoriale su F ).

Indichiamo con Di la derivata parziale rispetto alla i-esima indeterminata. Eulero dimostroun importante fatto sui polinomi omogenei.

Teorema 3.4.2. Sia f ∈ F [x1, . . . , xn] un polinomio omogeneo di grado k. Allora, comepolinomi in F [x1, . . . , xn][t] si ha

f(tx1, . . . , txn) = tkf(x1, . . . , xn);

inoltre kf =∑n

i=1 xiDif .

Dimostrazione. La prima proprieta si verifica facilmente sui monomi e quella generale euna conseguenza immediata.

3.4. POLINOMI OMOGENEI 33

Non e troppo complicato verificare che la derivata rispetto a t del primo membro en∑

i=1

xiDif(tx1, . . . , txn)

(e come il differenziale totale). La derivata del secondo membro e invece ktk−1f(x1, . . . , xn).Sostituendo allora 1 al posto di t, abbiamo la tesi. �

La prima condizione che abbiamo visto e anche sufficiente affinche un polinomio sia omo-geneo. La dimostrazione e lasciata per esercizio. Ci limiteremo da ora in poi a polinomi in treindeterminate, anche se le considerazioni si possono estendere facilmente a dimensione maggiore.

Dato un polinomio omogeneo f ∈ F [x1, x2, x3] di grado k, possiamo considerare gli elementi(a1, a2, a3) ∈ F 3 tali che

f(a1, a2, a3) = 0.

L’elemento (0, 0, 0) soddisfa sempre questa uguaglianza; inoltre, se (a1, a2, a3) la soddisfa e ρ ∈ F ,abbiamo certo anche

f(ρa1, ρa2, ρa3) = ρkf(a1, a2, a3) = 0.

Quindi e ben definito l’insieme dei punti del piano proiettivo

Cp(f) = { (a1 : a2 : a3) ∈ P 2(F ) | f(a1, a2, a3) = 0 }

che chiameremo ancora la curva definita da f . Siccome i punti impropri sono per convenzionequelli in cui a3 = 0, quelli propri sono i punti in cui si puo prendere a3 = 1. Ma allora i puntipropri della curva sono quelli della forma (a : b : 1) per i quali f(a, b, 1) = 0. Otteniamo dunqueuna curva algebrica affine eseguendo la sostituzione di x1 con x, di x2 con y e di x3 con 1.

Viceversa, dato un polinomio g ∈ F [x, y], non necessariamente omogeneo, ma non nullo,identifichiamo il suo grado totale k. Quindi, trasformiamo ogni monomio che vi compare, diciamoxiyj , in

xi1x

j2x

k−i−j3 .

La cosa e possibile perche, per ipotesi, i + j ≤ k. Otteniamo allora un polinomio omogeneof ∈ F [x1, x2, x3] di grado k, che ha la proprieta che

f(x, y, 1) = g(x, y).

Inoltre un punto (a, b) del piano affine appartiene alla curva C(g) se e solo se il punto (a : b : 1)del piano proiettivo appartiene alla curva Cp(f). In effetti abbiamo costruito un algoritmo perpassare da polinomi in due indeterminate a polinomi omogenei in tre e viceversa. Il polinomioottenuto da g si indichera con g; abbiamo allora

g(x, y) = g(x, y, 1);

se poi f ∈ F [x1, x2, x3] e g = f(x, y, 1), abbiamo

f = g.

Dunque la corrispondenza ottenuta e biunivoca. Si dimostri che g1g2 = g1g2.

Lemma 3.4.3. Se f1, f2 ∈ F [x1, x2, x3] e f1f2 e omogeneo, allora f1 e f2 sono omogenei.

Dimostrazione. Sia k il grado di f1f2. Possiamo scrivere f1 = f11 + f12 + · · · + f1r ef2 = f21 +f22 + · · ·+f2s dove ciascun addendo fij e omogeneo di grado kij , con ki1 < ki2 < · · · .Allora abbiamo f11f21 omogeneo di grado k11 + k21 = k; supponiamo r > 1. Allora f12f21 eomogeneo di grado k12 + k21 = k, cio che implica k12 = k11, assurdo. Analogamente non puoessere s > 1. �

Proposizione 3.4.4. Dato g ∈ F [x, y], g e irriducibile se e solo se g e irriducibile.

34 3. CURVE ALGEBRICHE

Dimostrazione. (⇒) Supponiamo che g = f1f2, con f1 e f2 omogenei. Allora g(x, y) =g(x, y, 1) = f1(x, y, 1)f2(x, y, 1), quindi possiamo supporre che f1(x, y, 1) sia costante. Cio signi-fica che nei monomi di f1 non compaiono x1 e x2, cioe che f1 = axk

3 . Dunque g = axk3f2, che va

contro il modo di costruire g, a meno che k = 1. Percio f1 e costante.(⇐) Supponiamo g = g1g2; allora g = g1g2 e quindi possiamo supporre che g1 sia costante;

ma allora g1 e costante. �

Vogliamo ora definire che cosa intendiamo per molteplicita di intersezione di una curva nelpiano proiettivo con una retta. Per semplicita parleremo solo di curve irriducibili, cioe definiteda un polinomio omogeneo irriducibile di grado > 1.

Una retta e definita da due punti (a1 : a2 : a3) e (b1 : b2 : b3) tali che i vettori u = [a1 a2 a3]T

e v = [b1 b2 b3]T siano linearmente indipendenti. Un punto di questa retta e della forma ˜λu + µv,con λ e µ non entrambi nulli. Possiamo allora sostituire in f , polinomio omogeneo che definiscela curva, xi con λai + µbi (i = 1, 2, 3). Otteniamo allora un polinomio omogeneo in λ e µ digrado k uguale al grado di f :

c0λk + c1λ

k−1µ + c2λk−2µ2 + · · ·+ ck−1λµk−1 + ckµk.

In generale, se f ∈ F [x1, x2] e omogeneo, possiamo trovarne i fattori di grado 1, che sarannodella forma

a1x1 + a2x2.

Due di questi fattori sono associati (cioe non sono fattori essenzialmente diversi) quando esiste unρ 6= 0 tale che la moltiplicazione per ρ trasformi uno nell’altro. Una radice di questo polinomioe allora un’espressione della forma (λ : µ), dove a1λ + a2µ = 0. Dovrebbe essere allora chiaroche cosa si intende per molteplicita di una radice. Una radice (λ : µ) ha molteplicita r se

(µx1 − λx2)r

divide il polinomio dato e la potenza successiva no.

Teorema 3.4.5. Sia f ∈ F [x1, x2, x3] omogeneo di grado k > 1 e irriducibile. Se F ealgebricamente chiuso, ogni retta proiettiva incontra la curva Cp(f) in k punti, contati con laloro molteplicita.

Il numero di intersezioni quando il campo non e algebricamente chiuso potrebbe essereminore. Siccome pero nel seguito ci interesseranno le curve di grado 3 e rette che sappiamoincontrarle in due punti, il terzo ci deve essere per forza.

Un punto di una curva si dice un flesso se la tangente in quel punto ha molteplicita diintersezione almeno 3. Questo dice, ad esempio, che una conica non ha flessi. Invece una cubicane ha sempre.

Se f ∈ F [x1, x2, x3] e omogeneo, il suo Hessiano e

H(f) = det

D1D1f D1D2f D1D3fD2D1f D2D2f D2D3fD3D1f D3D2f D3D3f

.

Questo e un polinomio omogeneo di grado 3(k − 2), se k e il grado di f . Si dimostra che i flessidella curva definita da f sono fra i punti di intersezione della curva definita da f con la curvadefinita da H(f) (fra questi ci sono anche i punti singolari). Se k = 3 il grado dell’Hessiano eancora 3 (almeno quando la caratteristica non e 2).

Come esempio, prendiamo f = x31 − x2

1x3 + x22x3, cioe il Folium di Cartesio in C. Il suo

Hessiano e

H(f) = det

6x1 − 2x3 0 −2x1

0 2x3 2x2

−2x1 2x2 0

= 8(x22x3 − 3x1x

22 − x2

1x3).

3.4. POLINOMI OMOGENEI 35

Si puo verificare che i punti di intersezione sono (0 : 1 : 0) e la coppia di punti complessi coniugati(43

: ± 4i

3√

3: 1)

.