1 Il problema dei fondamenti della geometria come … assimilato ad una dimostrazione, si pu`o...

80
l Dipartimento di Matematica “Guido Castelnuovo” Universit` a degli Studi di Roma “La Sapienza”, a.a. 2009-2010 Appunti del corso FONDAMENTI DELLA GEOMETRIA Prof. Pier Vittorio Ceccherini Parte Prima: Dalla geometria elementare alla geometria degli iperspazi 1 Il problema dei fondamenti della geometria come parte di quello dei fondamenti della matematica Il problema dei fondamenti della geometria non pu` o prescindere da quello pi` u generale dei fondamenti della matematica. Per semplicit` a ci si limiter` a a considerare principalmente la posizione assunta al riguardo da tre giganti della matematica – Euclide, Hilbert e G¨ odel – tre giganti che hanno segnato altrettante tappe fondamentali nella storia della matematica. Tra l’epoca di EUCLIDE (III sec. a.C.) e quella di David HILBERT (1862-1943) e di Kurt G ¨ ODEL (1906-1978) corre un periodo di oltre duemila anni. ` E perci` o impossibile dare conto delle numerose ed importanti conquiste del pensiero matematico che sono maturate in un cos` ı ampio lasso di tempo e che sono state esse stesse determinanti anche per il problema dei fondamenti.

Transcript of 1 Il problema dei fondamenti della geometria come … assimilato ad una dimostrazione, si pu`o...

l

Dipartimento di Matematica “Guido Castelnuovo”Universita degli Studi di Roma “La Sapienza”, a.a. 2009-2010

Appunti del corsoFONDAMENTI DELLA GEOMETRIA

Prof. Pier Vittorio Ceccherini

Parte Prima:Dalla geometria elementare alla geometria degli iperspazi

1 Il problema dei fondamenti della geometria come parte di quellodei fondamenti della matematica

Il problema dei fondamenti della geometria non puo prescindere da quello piu generale dei fondamenti dellamatematica. Per semplicita ci si limitera a considerare principalmente la posizione assunta al riguardo datre giganti della matematica – Euclide, Hilbert e Godel – tre giganti che hanno segnato altrettante tappefondamentali nella storia della matematica.

Tra l’epoca di EUCLIDE (III sec. a.C.) e quella di David HILBERT (1862-1943) e di Kurt GODEL(1906-1978) corre un periodo di oltre duemila anni. E percio impossibile dare conto delle numerose edimportanti conquiste del pensiero matematico che sono maturate in un cosı ampio lasso di tempo e che sonostate esse stesse determinanti anche per il problema dei fondamenti.

1.1 La matematica di Euclide

1.1.1. Matematica pre-ellenica E oggi universalmente riconosciuto che ancor prima della civiltagreca fosse notevolmente sviluppata una matematica di rilievo. Nei documenti piu antichi che ci sonopervenuti dall’Egitto e dalla Caldea sono largamente utilizzate le nozioni, gia fortemente astratte, di numerointero e di misura delle grandezze. Una ancor piu significativa documentazione ci proviene dalla successivacivilta babilonese, che ci mostra un’”algebra” che utilizza metodi eleganti e sicuri e che e qualcosa di piudi una semplice raccolta di problemi risolti in modo empirico. Sebbene non vi sia presente niente che possaessere assimilato ad una dimostrazione, si puo riconoscere - nella ripetizione dei metodi risolutivi utilizzati- il prodotto di precedenti concatenazioni logiche, sviluppate forse in modo inconscio, del tipo di quelle cheprecedono ancor oggi la sistemazione logica e la messa in chiaro di una verita matematica o di una formulache si comincia ad intuire.

1.1.2. L’innovazione della matematica greca E merito precipuo dei Greci di aver effettuatouno sforzo del tutto cosciente volto ad organizzare le dimostrazioni matematiche attraverso una sequenzadi passaggi logici che non lasciassero alcun dubbio e che potessero essere riconosciuti come assolutamentevalidi da tutti. Questo canone ideale – probabilmente rispettato fin dai primi contributi conseguiti trail VI ed il IV sec. a.C. ed attribuiti a TALETE, a PITAGORA e a EUDOSSO – trova poi una sua pienarealizzazione in epoca alessandrina (III sec. a.C.) nell’opera della famosa triade di EUCLIDE, ARCHIMEDEe APOLLONIO, per i quali la nozione di dimostrazione non differiva in nulla dalla nostra.

E interessante notare come tutto questo fiorire della matematica greca si fosse accompagnato a quello dellafilosofia, che aveva raggiunto il suo culmine con l’opera di PLATONE e di ARISTOTELE. Le prime riflessionisul carattere astratto degli enti matematici e sul procedere della matematica per successive deduzioni sitrovano espresse proprio in Platone ed in aristotele. Di essi e ben noto linteresse per la matematica e per lalogica, tanto che Platone aveva fatto scrivere all’ingresso della sua Accademia di Atene la celebre frase Nonentri chi non sa la geometria.

Il fenomeno del sorgere e dell’affermarsi della matematica greca – una matematica non soltanto ricca dirisultati ma impostata su basi metodologiche completamente nuove – si comprende soltanto alla luce delcontemporaneo fiorire della filosofia. All’origine della filosofia greca troviamo la ricerca di una spiegazionedella natura, il tentativo di ricondurre la materia a pochi elementi fondamentali. Quasi certamente questastessa motivazione – il voler sviluppare un’indagine razionale sulla natura – fu per i greci il motivo ispiratoredella ricerca matematica, riconosciuta come necessario strumento propedeutico.

Non siamo a conoscenza di esplicite dichiarazioni fatte in tal senso dagli autori, tranne che nel caso diTOLOMEO (II sec. d.C.), il quale in un suo passo dichiara di aver sviluppato la trigonometria in vista dellesue applicazioni all’astronomia. Fin dalle origini, la matematica doveva essere presso i greci tutt’altro cheuna disciplina isolata; EUDOSSO era principalmente un astronomo, e lo stesso EUCLIDE scrisse i Fenomeni(opera di astronomia, che trattava la geometria della sfera in vista dello studio del moto della sfera celeste),l’Ottica (un trattato che consiste di varie definizioni e postulati e di 58 proposizioni), la Catottrica (teoriadella riflessione e degli specchi), gli Elementi di musica e alcuni saggi di meccanica. L’intento di applicare lamatematica alla fisica si trova notoriamente nell’opera di Archimede (autore di opere di ottica e di meccanica,quali Catottrica, Sui baricentri, Sui corpi galleggianti, Sulle leve, Sull’equilibrio dei piani); lo stesso intentoe ben presente anche in Apollonio (autore di un ampio studio su Gli specchi ustori).

2

1.1.3. Il contenuto degli Elementi 1. Non ci e pervenuto alcuno scritto di Euclide relativo alle sueidee sul modo di procedere della matematica, nessuna riflessione insomma di filosofia della matematica, comeinvece si trova in Platone e in Aristotele. Euclide non teorizza sulla matematica ma fa matematica. Tuttaviai suoi Elementi – oltre ad essere un bagaglio di dottrina ancora oggi vivo e presente pressoche inalteratonell’insegnamento pre-universitario della geometria – hanno storicamente costituito, per l’organicita dellaloro articolazione, per il rigore2 delle argomentazioni e dei metodi, un modello preciso al quale si sonoattenuti tutti i matematici dopo di lui.

Esaminiamo dunque, seppure sommariamente, quest’opera, la sua struttura, i suoi pregi e i suoi limiti,quali sono stati messi in risalto dalla critica moderna.

Gli Elementi si compongono di 13 Libri, nei quali vengono svolti argomenti di geometria, di aritmeticae di algebra. La trattazione ha un carattere prettamente teorico, che prescinde da ogni regola di misura odi calcolo, da ogni applicazione pratica3; ad esempio Euclide dimostra il teorema sulla proporzionalita deicerchi ai quadrati dei raggi, ma non si occupa di determinare il relativo rapporto costante4.

Nei Libri I-IV vengono trattate le proprieta fondamentali dei poligoni e dei cerchi: uguaglianza deitriangoli, teoria delle parallele, equivalenza dei poligoni, quadratura di un poligono (cioe costruzione di unquadrato equivalente ad un poligono assegnato), proprieta del cerchio, poligoni regolari.

Nel Libro V – un vero capolavoro di astrazione – si prescinde dalla geometria e si sviluppa la teoria delleproporzioni tra grandezze.

Il Libro VI applica la teoria delle proporzioni alla geometria, studiando le proprieta dei poligoni simili.Il libro termina con la costruzione di un poligono che sia equivalente ad un poligono dato P e sia simile adun poligono dato Q (quando Q e un quadrato, si ricade nella quadratura di P ).

I Libri VII-IX non riguardano la geometria, ma la teoria dei numeri (interi). Euclide rappresentai numeri come segmenti ed il prodotto di due numeri come un rettangolo, ma gli argomenti che egli usanon sono geometrici. Anzi, alcune definizioni e teoremi, ad esempio sulle proporzioni, sono ripetizioni diquelli svolti per le grandezze; forse Euclide, nel rispetto della tradizione pitagorica, intendeva sottolinearel’autonomia della teoria dei numeri da ogni teoria geometrica e risentiva forse anche della visione di Aristoteleche, pur considerando il numero come una specie di grandezza, metteva in rilievo la differenza esistente tracontinuo e discreto. Celebri sono la sua dimostrazione che i numeri primi sono piu di qualunque moltitudineassegnata di numeri primi5 (cioe del fatto che esistono infiniti numeri primi) e quella dell’unicita dellafattorizzazione di un numero in fattori primi.

Il Libro X contiene la classificazione degli incommensurabili e precisamente delle cosiddette irrazionalitaquadratiche. Due segmenti sono commensurabili in lunghezza se lo sono nel senso usuale; sono commensurabiliin potenza se tali sono i quadrati costruiti su essi. Ad es. il lato e la diagonale di un quadrato sonoincommensurabili in lunghezza ma commensurabili in potenza.

I Libri XI-XIII riguardano la geometria solida, il metodo di esaustione6 , i poliedri regolari.

1.1.4. Il metodo ipotetico-deduttivo negli Elementi. Il Libro I si apre con tre serie di principi: ledefinizioni, i postulati e le nozioni comuni). In effetti le definizioni (oroi) vengono espresse con termini che

1Oltre che degli Elementi, Euclide e autore anche di altre opere matematiche. Alcune ci sono pervenute: i Dati, (che sonouna sorta di esercizi per ripassare gli Elementi); Sulla divisione (che tratta della suddivisione di una figura geometrica in altrefigure). Altre opere sono invece andate perdute e ne siamo a conoscenza per quanto ce ne hanno riferito PROCLO o PAPPOo altri commentatori: le Coniche (opera in quattro libri, che secondo Pappo costituirono poi i primi tre capitoli delle Sezioniconiche di Apollonio): la Pseudaria (una raccolta di dimostrazioni giuste e sbagliate, presentate per esercitare il ragionamentodei discepoli); i Porismi [cioe Proposizioni] (che trattavano problemi di costruzioni geometriche); i Luoghi superficiali (operain due libri, che trattava probabilmente di alcune superfici caratterizzate come luoghi geometrici).

2L’importanza del rigore era fortemente sentita in Euclide, un rigore che non ammetteva sconti. A questo riguardo, Procloracconta che Euclide, richiesto dal re Tolomeo se non ci fosse un mezzo piu breve degli Elementi per imparare la geometria,rispose che in geometria non esistono vie regie.

3Come racconta Strobeo, quando un allievo chiese ad Euclide quale utilita egli avrebbe ricavato dagli studi della geometria,il maestro caccio il malcapitato dopo avergli fatto consegnare qualche moneta

4Il calcolo di valori approssimati di π verranno poi forniti da Archimede.5Se p1, p2, . . . , pn sono numeri primi, e se q e un fattore primo di N = p1p2 . . . pn + 1, allora q /∈ {p1, p2, . . . , pn}.6Il metodo di esaustione - introdotto da Eudosso (IV sec. a.C.) e precursore della moderna analisi infinitesimale - viene

utilizzato per il calcolo di aree e volumi: esso consiste nel considerare successioni di figure inscritte e circoscritte alla figura inesame sempre piu ”vicine” alla figura data, la cui misura risulta elemento di separazione delle misure di quelle figure che laapprossimano per difetto e per eccesso.

3

non vengono definiti. Forse Euclide era cosciente che esse non avevano alcuna validita logica, ma intendevaspiegare intuitivamente che cosa rappresentassero quei termini, in modo da poterli utilizzare nei postulatifornendo una migliore comprensione dei postulati stessi. Modernamente parlando, sarebbero da denominareconcetti primitivi , termini appunto, definiti poi implicitamente dai postulati.

Dopo le definizioni, Euclide enuncia cinque postulati (richieste, αιτηµατα, aitemata) e cinque nozionicomuni (koinai ennoiai). I libri successivi non contengono ne postulati ne nozioni comuni, mentre alcunedefinizioni sono poste all’inizio dei Libri II-VII e X-XI.

Secondo una distinzione che risale ad Aristotele, i postulati si riferiscono propriamente alla geometria,mentre le nozioni comuni esprimono proprieta piu generali, applicabili a tutte le scienze.

Nel successivo sviluppo storico della matematica – almeno fino alla creazione delle geometrie non-euclidee – sia i postulati che le nozioni comuni vennero considerati come espressioni di verita certe, che nonpotevano essere messe in discussione. E peraltro interessante rilevare come l’originario punto di vista delpensiero greco fosse al riguardo assai meno netto, Secondo lo stesso Aristotele, non era necessario accertarela verita dei postulati, in quanto essa sarebbe stata certificata a posteriori dalla concordanza dei risultati de-dotti dai postulati con la realta, cioe fondamentalmente con l’esperienza empirica. E poi d’indubbio interesseche PROCLO (410-485 d.C.), il primo commentatore importante di Euclide, avesse – gia nel V sec. d.C. –precorso la moderna visione della matematica come scienza ipotetico-deduttiva, Arrivando egli a descrivereesplicitamente la matematica come una scienza ipotetica, che si limita a trArre deduzioni dalle assunzioni,indipendentemente dal fatto che queste siano vere o false.

Riguardo all’esistenza e alla coerenza dei concetti definiti, Euclide non si pronuncia; tuttavia i primi trepostulati del Libro I (vedi appresso) asseriscono la possibilita di costruire rette e cerchi e quindi ne affermanol’esistenza (sottintendendone l’unicita). Di fatto, quella di Euclide e un’impostazione costruttivistica econseguentemente finitistica.

Riportiamo qui di seguito – oltre ad una selezione delle definizioni piu importanti dei vari Libri – tuttii postulati e tutte le nozioni comuni (che come detto si trovano soltanto all’inizio del Libro I).

Alcune definizioni presenti negli Elementi(una selezione, dai libri I, V, VII, XI):

Def I-1: Punto e cio che non ha parti.Def I-2: Linea e lunghezza senza larghezza.Def I-3: Estremi di una linea sono punti.Def I-4: Linea retta e quella che giace ugualmente rispetto ai suoi punti.Def I-5: Superficie e cio che ha soltanto lunghezza e larghezza.Def I-6: Estremi di una superficie sono linee.Def I-7: Superficie piana e quella che giace ugualmente rispetto alle sue rette.Def I-8: Angolo piano e l’inclinazione reciproca di due linee su un piano, le quali s’incontrino tra loro enon giacciano in linea retta. (Si escludono gli angoli piatti).Def. I-15: Cerchio e una figura piana limitata da un’unica linea, tale che tutte le rette condotte su di essada un punto fra quelli interni alla figura sono uguali fra loro.Def I-16: Quel punto si chiama centro del cerchio.Def I-17: Diametro del cerchio e una retta tracciata per il centro e limitata in entrambe le direzioni dallacirconferenza, tagliando il cerchio per meta.Def I-23: Parallele sono quelle rette che, essendo nello stesso piano e venendo prolungate indefinitamenteda entrambe le parti, non si incontrano fra loro in nessuna di queste.Def. V-3: Rapporto di due grandezze omogenee e un certo modo di comportarsi rispetto alla quan-tita.Def V-4: Si dice che hanno rapporto le grandezze le quali possono, se moltiplicate, superArsi reciproca-mente7.

7A norma delle Def. V-3 e V-4, Euclide considera aventi rapporto tra loro due grandezze soltanto quando esse siano omogeneeed Archimedee; in particolare Euclide esclude dalla sua geometria gli angoli tra curve, in particolare l’angolo di contingenza,ossia quello tra la circonferenza ed una sua tangente. Si noti che Euclide non formula la proprieta di Archimede sotto laforma esplicita di un postulato, come facciamo noi, ma restringe comunque le proprie considerazioni alle ”grandezze che hanno

4

Def VII-1: Unita e cio secondo cui ciascun ente e detto uno.Def VII-2: Numero e una pluralita composta da unita8.Def XI-1: E un solido cio che ha lunghezza, larghezza e altezza.Def. XI-2: Limite di un solido e una superficie.

I cinque Postulati degli Elementi(tutti nel Libro I)

1o Postulato: Risulti postulato: che si possa condurre una retta da qualsiasi punto ad ogni altro punto.2o Postulato: E che si possa prolungare una retta finita continuamente in linea retta.3o Postulato: E che si possa descrivere un cerchio con qualsiasi centro e ogni distanza.4o Postulato: E che tutti gli angoli retti siano uguali fra loro.5o Postulato: E che se una retta, venendo a cadere su due rette forma gli angoli interni da una stessa parteminori di due angoli retti, le due rette prolungate indefinitamente si incontrano dalla parte in cui sono gliangoli minori di due retti.

Le cinque nozioni comuni degli Elementi(tutti nel Libro I)

1a Nozione comune: Cose che sono uguali a una stessa cosa sono uguali anche tra loro.2a Nozione comune: E se a cose uguali si aggiungono cose uguali, le somme sono uguali.3a Nozione comune: E se a cose uguali si sottraggono cose uguali, i resti sono uguali.4a Nozione comune: E le cose che coincidono fra loro sono fra loro uguali.5a Nozione comune: E il tutto e maggiore della parte.

Pregi e limiti della geometria di Euclide. Il grande merito di Euclide consiste nell’aver raccoltouna serie di conoscenze accumulatesi prima di lui, di averle integrate con propri contributi originali e so-prattutto di aver presentato tutto questo materiale in modo ordinato e organico, argomentando in modologicamente conseguente le varie proposizioni e teoremi, gettando insomma le basi del moderno metodoipotetico-deduttivo. Tuttavia si puo notare che molte delle sue definizioni non sempre definiscono, e che lesue dimostrazioni richiedono taluni assiomi non enunciati esplicitamente, quali il postulato di Archimede,il postulato di continuita della retta, ed i postulati riguardanti l’ordine lineare sulla retta. Bisogneraaspettare oltre 2000 anni prima che queste pecche vengano sanate dai matematici della fine del XIX secolo.

Il 5o Postulato. Il 5o Postulato e il famoso postulato delle parallele che viene comunemente enunciatonella forma (siamo in un piano); Per un punto esterno ad una retta, passa un’unica retta parallela allaretta data (cioe non secante la retta data). Si noti che nella formulazione di Euclide, il parallelismo vienedescritto in negativo, in quanto pone una condizione affinche due rette (complanari) non siano parallele. Ilpostulato afferma in sostanza che per un punto fuori di una retta esiste al piu una parallela alla retta data,mentre si puo poi dimostrare l’esistenza di una parallela utilizzando gli altri assiomi euclidei (e la proprietadi continuita all’interno del fascio di rette di centro quel punto). E ben noto come questo postulato abbiaattirato l’attenzione dei matematici, nel tentativo di dimostrarlo come teorema, tentativo che e fallito a

rapporto”, per le quali, in base alla Def V-4 stessa, vale la proprieta di Archimede.8Dunque, per Euclide ”numero” significa numero intero positivo.

5

seguito della creazione delle geometrie non-euclidee (nel sec. XIX), le quali dimostrano l’indipendenzadel 5o Postulato dai primi quattro. Nella geometria non euclidea di Riemann (geometria ellittica) il 5o Pos-tulato viene sostituito dalla richiesta che per un punto esterno ad una retta non passi alcuna parallela allaretta data; nella geometria non euclidea di Lobatchevski - Bolyai (geometria iperbolica) si richiede inveceche per un punto esterno ad una retta passino due parallele alla retta data (e si dimostra che di conseguenzane passano infinite)9. Si noti che il 5o Postulato perde significato nella geometria proiettiva (nella quale lanozione di parallelismo non ha senso).

Il problema della coerenza della geometria euclidea (cioe la proprieta che lo sviluppo della teoria nonconduca a contraddizioni) non si pose per molto tempo, perche si pensava che questa geometria fosse precisa-mente corrispondente alla realta del mondo fisico ed in esso trovasse a priori la propria legittimita piena. Maquando furono scoperte le geometrie non-euclidee, queste certezze cominciArono a vacillare, e sorse anche ilnuovo problema della coerenza delle stesse geometrie non-euclidee. Tuttavia la scoperta ad opera di EugenioBELTRAMI (1835-1900) e di Felix KLEIN (1849-1925) di modelli, che realizzavano le geometrie non-euclideeall’interno della geometria euclidea, provo che se la geometria euclidea e coerente, allora anche la geometriaellittica e la geometria iperbolica lo sono. Attualmente, si ritiene che si debba di volta in volta utilizzare iltipo di geometria piu adatto al problema che si sta studiando: ad esempio, nella teoria della relativita diAlbert EINSTEIN (1879-1955) le geometrie non-euclidee hanno ricevuto applicazioni importanti, mentre lageometria euclidea e piu utile per le applicazioni tradizionali.

In base alle successive ricerche di Hilbert e di altri, la coerenza della geometria euclidea fu a sua voltaricondotta a quella dell’aritmetica, come vedremo nel prossimo paragrafo. Fu similmente ricondottaa quella dell’aritmetica anche la coerenza della geometria euclidea a piu dimensioni, una coerenzache appariva ancor piu problematica mancando per tale geometria l’interpretazione intuitiva basata sullospazio ordinario, tanto che difficilmente un matematico della meta dellOttocento sarebbe stato disposto adaccettarla.

1.2 I fondamenti della geometria secondo Hilbert.

La geometria euclidea10 e stata assiomatizzata in modo rigoroso da David HILBERT (1899), tramite assiomiindipendenti. Questo traguardo e stato raggiunto grazie alla combinazione di due grandi conquiste matem-atiche ottenute precedentemente.

La prima conquista e l’invenzione, dovuta a CARTESIO (Rene DESCARTES, 1596-1650) della geome-tria analitica, ossia del metodo di usare le coordinate per lo studio della geometria. Per lo spazio euclideoordinario, cioe tridimensionale, si usano tre coordinate per rappresentare un punto, una equazione o unsistema di equazioni per rappresentare un piano, una retta, una curva, una superficie.

La seconda conquista e la creazione in termini rigorosi dei numeri reali, ottenuta alla fine del XIXsecolo ad opera principalmente di Richard DEDEKIND (1831-1916), di Georg CANTOR (1845-1918) e dellostesso Hilbert. Il punto di arrivo delle ricerche sui fondamenti dei numeri reali e la presentazione del camporeale come (l’unico) campo ordinato archimedeo completo. Vediamo di che si tratta. L’insieme Rdei numeri reali costituisce un campo rispetto alle usuali operazioni di somma e prodotto. Inoltre R e uncampo ordinato rispetto all’ordinamento usuale; piu precisamente R e un campo ordinato archimedeo, ossiadati comunque due numeri reali positivi esiste un multiplo dell’uno che supera l’altro. Si puo dimostrare cheun qualunque corpo ordinato archimedeo K e necessariamente commutativo, cioe e un campo, ed e precisa-mente (a meno di isomorfismi) un sottocampo del campo reale; dunque il campo reale R si caratterzza comel’unico campo archimedeo non estendibile ad un campo ordinato archimedeo piu ampio, ossia, come si dice,si caratterizza come (il) campo ordinato archimedeo completo.

In base a queste due conquiste si riconosce che lo spazio tridimensionale studiato da Euclide (correttocon l’esplicita aggiunta di un postulato di continuita della retta) si identifica (e isomorfo) con lo spazionumerico R3. In questo spazio numerico i punti sono le terne ordinate (x, y, z) di numeri reali, un pianoe il luogo dei punti (x, y, z) che sono soluzione di un’equazione del tipo ax + by + cz + d = 0, con coefficienti

9Cfr. R. Betti, Lobacevskij. L’invenzione delle geometrie non euclidee. Bruno Mondadori, 2005.10Oggi per ’geometria euclidea’ si intende lo studio del gruppo ortogonale in uno spazio vettoriale euclideo.

6

reali di cui i primi tre non tutti nulli, ed una retta e il luogo dei punti (x, y, z) che sono soluzione di unsistema di due equazione di quel tipo e che siano indipendenti e compatibili.

Il problema di assiomatizzare lo spazio euclideo tridimensionale, inteso come totalita dei suoi punti, dellesue rette e dei suoi piani si traduce e si precisa dunque in quello di assiomatizzare lo spazio numerico R3

(spazio tridimensionale reale) inteso come totalita dei suoi punti, delle sue rette e dei suoi piani.

1.3 Caratterizzazione assiomatica dello spazio ordinario.

Presentiamo finalmente l’assiomatica di HILBERT per lo spazio tridimensionale reale11

Lo spazio e una terna A = (P,R,Π), dove P e un insieme non vuoto di oggetti detti punti, R un insiemenon vuoto di parti di P dette rette, Π un insieme non vuoto di parti di P dette piani, tali che R∩Π = ∅,e tali che siano soddisfatti i seguenti gruppi di assiomi:

I GRUPPO: assiomi dell’appartenenza.— Per due punti distinti qualunque passa una e ad una sola retta.— Per tre punti non allineati qualunque passa uno ed un sol piano.— Ogni retta contiene almeno due punti distinti, ogni piano contiene almeno tre punti non allineati,

lo spazio contiene almeno quattro punti non complanari.— Se due punti distinti di una retta appartengono ad un piano, la retta e contenuta nel piano.— Se due piani hanno in comune un punto, essi hanno in comune almeno un altro punto12.

II GRUPPO: assiomi dell’ordine.E data una relazione ternaria di intergiacenza tra punti allineati – che si denota scrivendo ABC e che silegge: B giace tra A e C – in modo che valgano i seguenti assiomi:— Se A,B,C sono punti allineati qualunque, allora ABC implica CBA.— Se A e C sono punti distinti qualunque, esiste almeno un B tale che ABC13 ed esiste almeno un D taleche ACD.— Dati tre punti distinti e allineati qualunque, esattamente uno di essi giace tra gli altri due.— Assioma di Pasch: Siano dati comunque tre punti non allineati A,B,C ed una retta del loro piano, laquale non passi per alcuno dei tre punti. Se la retta passa per un punto posto tra A e B, allora essa passaanche o per un punto posto tra B e C oppure per un punto posto tra A e C.

Nozione di segmento, di semiretta, di semipiano e di angolo. I primi due gruppi di assiomipermettono di introdurre i concetti di segmento, di semiretta, di semipiano e di angolo.

Se A e B sono due punti distinti ed a e la retta che li contiene, si chiama segmento di estremi A e Bl’insieme dei punti di a posti tra A e B. Gli altri punti si dicono esterni al segmento.

Dato un punto O di una retta a, possiamo dividere la retta in due semirette di origine O nel modoseguente. Si fissi su a un punto A distinto da O: la semiretta (aperta) OA — semiretta di a, di origine O e

11Hilbert formulo per la prima volta la sua assiomatizzazione nel 1899 con il volume Grundlagen der Geometrie, rielaborandonein seguito piu volte l’esposizione fino alla versione del 1930. Altre diverse assiomatizzazioni della geometria euclidea erano stateformulate dieci anni prima da Giuseppe PEANO (1858-1932) nei suoi Principi di Geometria (1889) e da Giuseppe VERONESE(1854-1917) nei suoi Fondamenti di Geometria (1891). Nei presenti appunti l’assiomatica di Hilbert viene esposta in modosemplificato. Anzitutto, nella esposizione originaria di Hilbert, gli insiemi P,R, Π dei punti delle rette e dei piani dello spaziosono tre insiemi astratti e l’appartenenza (∈ e ⊆) e sostituita da una relazione astratta di incidenza. Inoltre alcune proprietache qui figurano come assiomi sono ottenute come teoremi nell’esposizione originaria di Hilbert

12Si noti che questa proprieta non e valida in Rn se n > 3.13Utilizzando l’Assioma di Pasch di cui e detto appresso, Hilbert dimostra che dati comunque due punti distinti A e B esiste

un punto B tale che ABC: a partire da A, C si compiano le seguenti costruzioni (il lettore faccia una figura): retta AC, puntoD non su AC, retta AD, punto E tale che ADE, retta EC, punto F tale che ECF , i punti A, C, E sono non allineati, la rettaDF non passa per questi punti e contiene un punto D del lato AE ma non contiene un punto del lato AC e quindi (per l’Assioma di Pasch) contiene un punto B del lato AC, ossia risulta ABC.

7

contenente A — e costituita dal punto A e dai punti X di a tali che OXA oppure OAX; l’altra semirettadi a di origine O e costituita dai punti Y di a tali che AOY . Aggiungendo ad una semiretta aperta la suaorigine si ottiene la corrispondente semiretta chiusa. In questo modo si ottiene una partizione di a in treclassi: il punto O e le due semirette aperte di a di origine O. Si puo dimostrare che un qualsiasi punto A′

della semiretta OA definisce la medesima semiretta.E l’assioma di Pasch che consente di definire i semipiani determinati in un piano α da una sua retta a:

si considera la relazione ρ definita nell’insieme dei punti di α \ a assumendo AρB se la retta a non contienepunti situati tra A e B; questa e una relazione (forzatamente) riflessiva, banalmente simmetrica e che risultatransitiva in virtu dellassioma di Pasch; infatti se AρB e se BρC allora AρC, come e banale se i tre puntisono allineati e come segue dall’assioma di Pasch se i tre punti non sono allineati. La relazione ρ determinain α\a una partizione in classi di equivalenza, che si riconoscono facilmente essere due e che, per definizione,costituiscono i due semipiani (aperti) di α determinati dalla retta a.

Siano date in un piano α due semirette a = OA e b = OB entrambe di origine un punto O. Tale dato sichiama angolo di lati OA e OB e di vertice O, e si denota con AOB oppure con ab. Si chiamano interniall’angolo tutti i punti di α i quali a due a due individuano segmenti non aventi alcun punto in comune coilati dell’angolo; si chiamano esterni all’angolo i punti di α i quali non siano interni e non appartengano ai lati.

III GRUPPO: assiomi della congruenza.E data una relazione di congruenza tra segmenti ed e data una relazione di congruenza tra angoli,entrambe denotate con ≡, in modo che valgano i seguenti assiomi:— Dati comunque due punti A,B ed una semiretta a′ di origine un punto A′, esiste un unico punto B′ di a′

tale che siano congruenti i segmenti AB e A′B′. cioe: AB ≡ A′B′.— Ogni segmento e congruente a se stesso: AB ≡ AB, AB ≡ BA.— Se AB ≡ A′B′ e A′B′ ≡ A′′B′′, allora AB ≡ A′′B′′.— Se su una retta a sono dati due segmenti AB e BC privi di punti in comune e su una retta a′ sono datidue segmenti A′B′ e B′C ′ privi di punti in comune, e se AB ≡ A′B′ e BC ≡ B′C ′, allora AC ≡ A′C ′.— Sia dato comunque un angolo ab in un piano α e sia data comunque in un piano α′ una retta r′ ed unpunto O′ di r′, e sia a′ una delle due semirette di r′ di origine O′. In ciascuno dei due semipiani di α′

individuati da r′ esiste esattamente una semiretta b′ di origine O′ tale che a′b′ ≡ ab e tale che tutti i puntiinterni dell’angolo a′b′ appartengano al semipiano di α′ considerato.— Ogni angolo e congruente a se stesso: ab ≡ ab e ab ≡ ba.— Se ab ≡ a′b′ e a′b′ ≡ b′′a′′ allora ab ≡ a′′b′′.— Dati comunque due triangoli ABC e A′B′C ′, tali che AB ≡ A′B′, AC ≡ A′C ′, BAC ≡ B′A′C ′, allora siha anche ABC ≡ A′B′C ′ e ACB ≡ A′C ′B′.

IV GRUPPO: assioma delle parallele.Dati comunque una retta a ed un punto A non appartenente ad a, esiste, nel piano individuato da A e da a,esattamente una retta b, passante per A e che non interseca a. Tale retta b dicesi la parallela per A ad a.

Nozione di spazio affine. Dicesi spazio affine (di dimensione 3) una qualunque terna ordinataA = (P,R,Π), del tipo detto all’inizio, i cui punti, rette e piani verificano tutti gli assiomi del I GRUPPO(assiomi di incidenza) e tutti quelli del IV GRUPPO (assioma delle parallele). Due spazi affini A = (P,R,Π)e A′ = (P ′,R′,Π′) si dicono isomorfi se esiste un isomorfismo f : A → A′, cioe una bijezione f : P → P ′ cheinduce una bijezione R → R′ ed una bijezione Π → Π′. Si puo dimostrare che:

Teorema 1 Ogni spazio affine 3-dimensionale e coordinatizzabile sopra un corpo K (eventualmente noncommutativo), nel senso che e isomorfo allo spazio affine numerico A3(K), i cui punti sono le terne ordinatedi numeri di K ed i piani e le rette vengono definiti di conseguenza (tramite equazioni) nel modo usuale14.

14Se K e un corpo commutativo, cioe un campo, si comprende bene come lo spazio affine numerico A3(K) possa essere definitosenza difficolta, come nel caso in cui K risulti essere il campo reale (vedi appresso la dimostrazione del Teorema 2). Il caso in

8

V GRUPPO: assiomi della continuita.— Assioma di Archimede. Siano dati su una qualunque retta a: un punto qualunque A1 posto tra duedati punti A e B; e siano dati altri punti A2, A3, A4, . . . , tali che A1 sia posto tra A e A2, A2 tra A1 e A3, A3

tra A2 e A4 e cosı via e tali che si abbiano le congruenze AA1 ≡ A1A2 ≡ A2A3 ≡ A3A4 ≡ . . . . Allora esistenella successione dei punti A2, A3, A4, . . . un punto An tale che B e posto tra A e An.— Assioma della completezza. Gli elementi (punti, rette, piani) della geometria costituiscono un sistemaA = (P,R,Π), che non si puo ampliare se si mantengono tutti gli assiomi precedenti.

Il requisito fondamentale che si richiede ad un sistema di assiomi e la sua coerenza (o consistenza),cioe la sua non contraddittorieta, ossia il fatto che lo sviluppo della teoria che muove da quegli assiominon conduce (e non potra mai condurre) a contraddizioni. La consistenza viene dimostrata fornendo unmodello che verifica tutti gli assiomi del sistema. Ad esempio, gli assiomi di gruppo sono consistenti, perchee possibile esibirne concretamente un modello (ad esempio un gruppo finito di ordine due!). Un’altra proprieta– interessante, ma non indispensabile, anzi talvolta non desiderabile didatticamente – e la indipendenzadegli assiomi del sistema, ossia l’impossibilita di dedurre qualcuno degli assiomi dai rimanenti. L’eventualeindipendenza puo essere dimostrata fornendo, per ciascun assioma del sistema, un modello che non verificaquell’assioma pur verificando tutti i rimanenti. Un’ulteriore ed importante proprieta (molto raramentesoddisfatta) e la categoricita del sistema di assiomi, intendendosi con cio che due qualunque modelli chelo verificano sono isomorfi, ossia completamente identificabili in senso astratto; cio si puo anche esprimeredicendo che e stata data una caratterizzazione assiomatica del modello in questione. Ad esempio, il sistemadi assiomi di gruppo non e categorico, mentre lo e quello di gruppo ciclico di ordine n fissato.

La consistenza (non contraddittorieta) del sistema degli assiomi di Hilbert si fonda sulla consistenza delcampo reale R (che a sua volta si fonda su quella del campo razionale Q, e quindi, in ultima analisi sullaconsistenza dell’ insieme N dei numeri naturali, cfr. appresso). Infatti si puo dimostrare il teorema:

Teorema 2 (”Consistenza” del sistema di assiomi di Hilbert.) Lo spazio numerico tridimensionalereale A3(R) soddisfa i cinque gruppi di assiomi di Hilbert.

Dimostrazione. (Cenni). Sia A3(R) = (P,R,Π) lo spazio numerico tridimensionale reale. In talespazio, l’insieme P dei punti e l’insieme R3 delle terne ordinate di numeri reali. L’insieme Π dei piani e:

Π := {αabcd | (a, b, c, d) ∈ R4, (a, b, c) 6= (0, 0, 0),

ove il piano αabcd e dato da:

αabcd := {(x, y, z) ∈ R3 | ax + by + cz + d = 0}.

L’insieme delle rette e:R := {α ∩ β | (α 6= β ∈ P) ∧ (α ∩ β 6= ∅)}.

cui K non sia commutativo, richiede qualche accortezza; si noti intanto che si i puo definire su un corpo K non commutativo(ad esempio sul corpo dei quaternioni reali) la nozione di spazio vettoriale destro (risp. sinistro), procedendo come nel casocommutativo, ma con l’accortezza di scrivere sistematicamente a destra (risp. a sinistra) lo scalare che moltiplica un vettore;per tali spazi si introducono al solito le nozioni di indipendenza lineare di vettori, di base, di dimensione, componenti di unvettore rispetto ad una base; si giunge cosı a dimostrare, nel solito modo, che uno spazio vettoriale destro (o sinistro) su uncorpo K di dimensione n e isomorfo allo spazio vettoriale numerico destro (o sinistro) n− dimensionale su K i cui vettori sonole n−ple ordinate di elementi di K. In modo analogo, si puo definire su un corpo K non commutativo (ad esempio sul corpo deiquaternioni reali) la nozione di spazio affine numerico destro (risp. sinistro) A3(K), avendo l’accortezza di scrivere le equazioniche definiscono i piani e le rette ponendovi i coefficienti sempre a sinistra (o sempre a destra) delle indeterminate. Si noti infineche la costruzione, a partire da un campo finito K = GF (q) con q elementi, del corrispondente spazio affine numerico A3(K)fornisce un semplice modello (molto concreto !) di spazio affine A3 e dunque assicura la non contraddittorietadella assiomatica di spazio affine A3. Queste considerazioni si estendono faciilmente al caso degli spazi affini e proiettivi didimensione d ≥ 2 qualunque. Avvertiamo infine che uno spazio del tipo A3(K) viene talvolta denotato anche con AG(3, K) osemplicemente con K3.

9

La facile verifica che gli assiomi di Hilbert sono soddisfatti da A3(R) si basa sulle proprieta ordinali edi continuita del campo reale R (che puo identificarsi con l’insieme dei punti di una retta), su proprietaelementari dei sistemi di equazioni lineari e su proprieta elementari del gruppo delle isometrie (congruenze)di R3. Si noti in particolare che, se A3(R) non soddisfacesse alla proprieta di completezza, allora sarebbeampliabile propriamente ad uno spazio, T , il quale – essendo uno spazio affine tridimensionale – sarebbe,per il Teorema 1, coordinatizzabile su un corpo K necessariamente ordinato archimedeo (al pari di T ), equindi commutativo; ne seguirebbe che K sarebbe un campo archimedeo, estensione propria di R, il che eimpossibile perche R e archimedeo completo. �

Si osservi che il Teorema 2 riconduce la ”consistenza” del sistema degli assiomi di Hilbert alla ”consis-tenza” del modello A3(R), ossia alla consistenza di R, vale a dire alla non contradditorieta della teoria deinumeri reali.

Teorema 3 ( (Categoricita del sistema di assiomi di Hilbert.) I precedenti cinque gruppi di assiomicaratterizzano lo spazio A3(R).

Dimostrazione. (Cenni). Un qualunque spazio T soddisfacente i cinque gruppi di assiomi e anzitutto unospazio affine tridimensionale, e quindi, per il Teorema 1 coordinatizzabile su un corpo K, e pertanto isomorfoallo spazio numerico su K, ossia T ' A3(K). Il campo K e ordinato archimedeo perche queste proprietasi trasportano facilmente da T a K. Pertanto K deve essere (a meno di isomorfismi) un sottocampo delcampo reale R ed anzi coincide (a meno di isomorfismi) col campo reale R, perche se per assurdo K fosseun sottocampo proprio di R, allora lo spazio A3(R) sarebbe un ampliamento proprio dello spazio T ; d’altraparte, A3(R) verifica i cinque gruppi di assiomi e viene cosı contraddetta la proprieta di completezza di T .L’assurdo prova che K ' R, e quindi T ' A3(K) ' A3(R). �

Il significato del Teorema 3 e che ogni spazio A′ = (P ′,R′,Π′) che verifichi gli assiomi di Hilbert e isomorfoallo spazio numerico A3(R) = (R3,R,Π) nel senso che esiste una bijezione f : R3 → P ′ che rispetta tutte lestrutture presenti e che quindi permette di indentificare A′ con A3(R). In altri termini: (1) f induce unabijezione R → R′ e una bijezione Π → Π′; (2) f conserva l’ordinamento, cioe la relazione di intergiacenza trapunti allineati; (3) f conserva la congruenza tra segmenti e quella fra angoli; (4) f conserva il parallelismo.

E facile convincersi che lo spazio affine numerico A3(Q) costruito sul campo razionale verifica tutti gliassiomi del sistema di Hilbert tranne il ”corrispondente assioma della completezza”: questo non e verificatoperche A3(Q) si puo ampliare propriamente a A3(R) che verifica tutti gli stessi assiomi.

Come gia detto precedentemente, si puo dimostrare che il sistema degli assiomi originari di Hilbert ecostituito da assiomi tra loro indipendenti. Si osservi che non e stata richiesta la proprieta simmetricadella relazione di congruenza (ad esempio tra segmenti), in quanto – come ora vedremo – essa puo dedursidalle proprieta riflessiva e transitiva con l’uso dell’assioma che esprime il ”trasporto di un segmento” su unasemiretta. Sia dunque AB ≡ A′B′; vogliamo provare che A′B′ ≡ AB. Sia C il punto della semiretta diorigine A che contiene B tale che A′B′ ≡ AC . Ne segue AB ≡ AC. Dalle AB ≡ AB e AB ≡ AC, si deduceB = C. Pertanto A′B′ ≡ AB.

1.4 Riconduzione della non contraddittorieta della geometria a quella dellaaritmetica.

Si e visto che la non contraddittorieta del sistema degli assiomi di Hilbert si basa sulla non contraddittorietadella teoria dei numeri reali. Ricordiamo come quest’ultima si riconduce a quella della aritmetica. Si ammetteche esista un modello ben fondato dell’insieme N dei numeri naturali; allora, a partire da questo dato, si

10

costruiscono successivamente l’anello Z degli interi, il campo Q dei razionali e, finalmente, il campo R deireali. Questo metodo di definizione del campo reale e dunque un metodo genetico (risalente a Dedekind),diverso dal metodo assiomatico di Hilbert che definisce in un solo colpo i reali come campo ordinatoarchimedeo completo.

Secondo una osservazione scherzosa di Bertrand RUSSELL (1872-1970)15, la differenza tra il metodogenetico e quello assiomatico e la stessa che passa tra il lavoro onesto ed il furto: con questo ci si impadroniscein un attimo di tutta la ricchezza accumulata faticosamente tramite quello.

1.4.1 I numeri naturali. Ricordiamo che a fondamento dell’aritmetica si trova l’insieme N dei numerinaturali, definito da Giuseppe PEANO (1858-1932) coi suoi famosi assiomi. In questi intervengono i concettiprimitivi di numero naturale, uno, successore: concetti che non vengano definiti, sebbene gli assiomi cheli riguardano ne danno una definizione implicita, nel senso che indicano le regole che li governano. Dopotutto,secondo la definizione scherzosa di Bertrand Russell, la matematica e la scienza in cui non si sa di che cosasi parla, ed in cui non si sa se quello che si dice sia vero o falso. (La seconda parte della frase sottolineal’aspetto della matematica come sistema ipotetico-deduttivo).

Assiomi di Peano.1. Uno e un numero naturale.2. Per ogni numero naturale esiste un ben determinato numero naturale successore di quello.3. Uno non e successore di alcun numero naturale.4. Due numeri naturali aventi lo stesso successore sono uguali fra loro.5. Se un insieme di numeri naturali contiene uno ed il successore di ogni suo elemento, allora quell’insiemecoincide con l’insieme di tutti i numeri naturali.

I primi quattro assiomi possono essere riformulati dicendo che e data una terna ordinata (N, 1, σ), taleche N e un insieme, 1 e un fissato elemento di N, e σ e un’applicazione iniettiva N → N \ {1} (”passaggio alsuccessore”). Il quinto assioma, noto col nome di principio d’induzione, si puo esprimere cosı:

[A ⊆ N, 1 ∈ A, σ(A) ⊆ A] ⇒ A = N.

L’esistenza di una terna verificante le proprieta anzidette non puo essere dimostrata, ma richiede unapposito ed esplicito assioma di esistenza. Come dice Leopold KRONECKER (1823-1891), ”Dio ha creato inumeri naturali, tutto il resto e opera dell’uomo”. E invece facile dimostrare l’unicita (a meno di ”isomor-fismi”) di una terna siffatta: se (N, 1, σ) e (N′, 1′, σ′) sono due tali terne, si puo definire un ”isomorfismo”f : N → N′, assumendo anzitutto f(1) := 1′, e definendo poi

(n ∈ N) f(σ(n)) = σ′(f(n));

si prova quindi che f e ben definita su tutto N, che f e biunivoca e conserva la struttura in gioco, ossiapermette di identificare le terne date.

Per iinduzione si definiscono poi in N le usuali operazioni di addizione:

(m,n ∈ N) 1 + n := σ(n), σ(m) + n := σ(m + n);

e di moltiplicazione:(m,n ∈ N) 1 · n := n, σ(m) · n := m · n + n;

e si definisce l’usuale ordinamento:

(m,n ∈ N) m < n ⇔ ∃h ∈ N : m + h = n.

15Bertrand Russell e autore insieme a A. N. Whitehead della monumentale opera Principia mathematica (1910-1913) in cuivengono esposte le basi assiomatiche del calcolo dei predicati e della logica matematica.

11

Anche le usuali proprieta formali delle operazioni + e · si dimostrano per induzione.

1.4.2. L’anello degli interi. Si passa dal gruppoide N(+) al gruppo additivo Z(+) degli interi, persimmetrizzazione. Da questo si passa poi facilmente all’anello Z(+,·) degli interi. In altri termini, l’insiemeZ e definito costruttivamente da N, assumendo

Z := (N× N)/ ≡1,

dove l’equivalenza ≡1 e definita in N× N da:

(a, b) ≡1 (c, d) :⇔ a + d = b + c.

La somma in Z e ben definita da:

(a, b, c, d ∈ N) [(a, b)] + [(c, d)] := [(a + c, b + d)].

Il prodotto in Z e ben definito da:

(a, b, c, d ∈ N) [(a, b)] · [(c, d)] := [(ac + bd, ad + bc)].

L’ordinamento in Z e ben definito da:

(a, b, c, d ∈ N) [(a, b)] < [(c, d)] :⇔ a + d < b + c.

Si ha l’immersione (cioe un’applicazione iniettiva che conserva la somma, il prodotto e l’ordinamento)

N(+,·,<) → Z(+,·,<) : n 7→ [(σ(n), 1)].

Lo zero di Z(+) e la classe 0 = [(n, n)], n ∈ N. Se n ∈ N , il numero [(σ(n), 1)] di Z si denota ancora con n,ed il numero [(1, σ(n))] si denota con −n, la classe [(a, b)] si denota anche con a− b, ecc.

1.4.3. Il campo dei razionali. Si passa dall’anello Z(+,·) degli interi al campo Q(+,·) dei razionali,ottenendolo come suo campo dei quozienti. In altri termini, l’insieme Q e definito costruttivamente da Z,assumendo:

Q := (Z× (Z \ {0}))/ ≡2,

dove l’equivalenza ≡2 e definita in Z× (Z \ {0}) da:

(a, b) ≡2 (c, d) :⇔ ad = bc.

Ogni classe [(a, b)] ∈ Q si denota con a/b; le operazioni e l’ordinamento in Q sono ben definiti da:

a/b + c/d := (ad + bc)/(bd), (a/b)(c/d) := (ac)/(bd), (a/b) < (c/d) :⇔ ad < bc.

Si ha l’immersioneZ(+,·,<) → Q(+,·,<) : a 7→ a/1,

ed il numero a/1 ∈ Q si denota ancora con a, ecc.

1.5 Il campo dei reali.

Storicamente, i numeri reali sono stati definiti costruttivamente a partire dai numeri razionali (metodogenetico: di Cauchy (Augustin-Louis CAUCHY, 1789-1857), di Dedekind, di Cantor) ). Vedremo poi che inumeri reali possano essere definiti assiomaticamente (metodo assiomatico di Hilbert).

12

1.5.1. I numeri reali secondo il metodo di Cauchy. Si passa dal campo razionale Q al campo realeR, ad esempio col procedimento costruttivo di completamento alla Cauchy :

R := C(Q)/ ≡,

dove C(Q) e l’insieme delle successioni di Cauchy di numeri razionali e ≡ e la relazione di equivalenzache dichiara equivalenti due successioni di Cauchy a, b ∈ C(Q) la cui differenza a − b e una successioneinfinitesima: dunque un numero reale e una classe di equivalenza di successioni di Cauchy dinumeri razionali. Ricordiamo che una successione a = (ai) ∈ QN di numeri razionali ai,∈ Q, i ∈ N, sichiama una successione di Cauchy se:

(∀ε ∈ Q, ε > 0) ∃nε ∈ N : | am − an |< ε ∀n, m > nε,

e che una successione di Cauchy c = (ci) ∈ QN si dice infinitesima se

(∀ε ∈ Q, ε > 0) ∃nε ∈ N : | cn |< ε ∀n > nε,

Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (e il modo obbligato), esi ha l’immersione

Q(+,·,<) → R(+,·,<) : a 7→ [(a, a, . . . , a, . . . )],

ed il numero [(a, a, . . . , a, . . . )]∈ R si denota ancora con a, ecc. Si dimostra infine che ogni successione diCauchy di numeri reali e convergente (ad un numero reale).

1.5.2. I numeri reali secondo il metodo di Dedekind. Alternativamente: un numero reale e unasezione di Dedekind (o due sezioni di Dedekind equivalenti) del campo razionale. Ricordiamo di cosa sitratta. Una partizione ordinata (o sezione di Dedekind) (A,B) di Q e una partizione non banale di Qin due ’classi’ A e B:

Q = A ∪B, A ∩B = ∅, A 6= ∅ 6= B tale che : a ∈ A, b ∈ B ⇒ a < b.

Per ogni tale partizione esiste evidentemente al piu un elemento di separazione delle due classi cioe alpiu un q ∈ Q tale che

(a, b ∈ Q) (a < q ⇒ a ∈ A) e (q < b ⇒ b ∈ B).

Evidentemente, se q ∈ Q e elemento di separazione della partizione ordinata (A,B), allora necessariamenteq e il massimo della classe A oppure il minimo della classe B; in entrambi i casi, il numero q risultaessere elemento di separazione di due sezioni di Dedekind, potendosi attribuire q alla prima o alla secondaclasse: le due partizioni cosı ottenute sono distinte ma verranno considerate equivalenti (perche entrambeindividuano lo stesso q ∈ Q come proprio elemento di separazione); dunque ogni numero razionale q da luogoa due sezione di Dedekind (equivalenti) di cui e elemento separatore: la sezione

(A,B) con A := {x ∈ Q : x ≤ q}, B := {x ∈ Q : x > q}

ma anche la sezione

(A′, B′) con A′ := {x ∈ Q : x < q}, B := {x ∈ Q : x ≥ q}.

D’altra parte esistono sezione di Dedekind di Q prive di elemento separatore (in Q), ad esempio la sezioneottenuta assumendo

A := {x ∈ Q : (x < 0) ∨ (x2 < 2)}, B := {x ∈ Q : (x > 0) ∧ (x2 > 2)};

e infatti ben noto che non esiste alcun razionale x ∈ Q tale che x2 = 2. Se, come in questo caso, (A,B)e invece una sezione di Dedekind priva di elemento separatore in Q, la sua ’classe di equivalenza’ verraconsiderata costituita soltanto da (A,B). Se indichiamo con D(Q) l’insieme delle sezioni di Dedekind del

13

campo razionale e con ≡ la suddetta relazione di equivalenza in tale insieme, si puo, seguendo Dedekind,definire il campo reale assumendo

R := D(Q)/ ≡ .

Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (e il modo obbligato), esi ha l’immersione

Q(+,·,<) → R(+,·,<) : q 7→ [({a ∈ Q : a ≤ q}, {b ∈ Q : b > q}]},

e questo numero di R si denota ancora con q, ecc. Si dimostra infine che ogni sezione di Dedekind delcampo reale ammette un elemento di separazione.

1.5.3. I numeri reali secondo il metodo di Cantor. Alternativamente, ancora: si possono ottenerei numeri reali (alla Cantor) come classi di equivalenza di coppie di classi contigue di numeri razionali (dueclassi contigue dicendosi equivalenti se ”si rincorrono a vicenda”). Ricordiamo di cosa si tratta. Una coppia(A,B) di sottinsiemi non vuoti di Q si dice una coppia di classi contigue di numeri razionali se

a ∈ A, b ∈ B ⇒ a < b ed inoltre: ε ∈ Q, ε > 0 ⇒ ∃a ∈ A,∃b ∈ B tale che | a− b |< ε.

Evidentemente una coppia di classi contigue di numeri razionali ammette al piu un elemento di sepa-razione s ∈ Q. Un esempio di coppie di classi contigue che non ammettono in Q elemento di separazione esuggerito dalla scrittura decimale di

√2 = 1, 414213562373095: assumiamo

A = {1, 1, 4, 1.41, 1, 414, 1, 4142, 1, 41421, 1, 414213, 1, 4142135, 1, 41421356, . . . },

B = {2, 1, 5, 1.42, 1, 415, 1, 4143, 1, 41422, 1, 414214, 1, 4142136, 1, 41421357, . . . }.

Un esempio di coppia di classi contigue che ammette un dato numero q ∈ Q come elemento di separazione e:

A = {q − 110n

: n ∈ N}, B = {q +1

10n: n ∈ N}.

Questi stessi esempi suggeriscono di introdurre una relazione di equivalenza tra coppie di classi contigue, nelmodo seguente; sia Γ(Q) l’insieme delle coppie di classi contigue di numeri razionali e sia ≡ la relazione diequivalenza definita in Γ(Q) assumendo: (A,B) ≡ (A′, B′) se e soltanto se:

1) ∀a ∈ A ∃a′ ∈ A′ tale che a′ > a, 2) ∀a′ ∈ A′ ∃a ∈ A tale che a > a′,3) ∀b ∈ B ∃b′ ∈ B′ tale che b′ < b, 4) ∀b′ ∈ B′ ∃b ∈ B tale che b < b′.

seguendo Cantor, possiamo definire il campo reale assumendo

R := Γ(Q)/ ≡ .

Si ben definiscono in R la somma, il prodotto e la relazione d’ordine in modo ovvio (e il modo obbligato), esi ha l’immersione

Q(+,·,<) → R(+,·,<) : q 7→ [({q − 110n

: n ∈ N}, {q +1

10n: n ∈ N}]},

e questo numero di R si denota ancora con q, ecc. Si dimostra infine che ogni coppia di classi contiguedi numeri reali ammette un elemento di separazione.

14

1.5.4. I numeri reali secondo il metodo assiomatico di Hilbert. Per illustrare le linee generalidella caratterizzazione assiomatica di Hilbert dello spazio euclideo R3 della geometria elementare, abbiamoutilizzato la caratterizzazione del campo reale come corpo ordinato archimedeo completo. Ci proponiamoora di chiarire questo punto.

Supponiamo di aver gia introdotto il campo reale R come completamento del campo razionale Q. Questosignifica che ogni numero reale e una classe di equivalenza di successioni di Cauchy di numeri razionali, eche ogni successione di Cauchy di numeri reali e convergente ad un numero reale. Il campo reale R puoessere d’altra parte caratterizzato assiomaticamente – e quindi definito – come (l’unico) campo ordinatoarchimedeo completo. Ricordiamo di che si tratta.

Ricordiamo che un campo K si dice ordinato se e dato un sottinsieme P di K, detto insieme deglielementi positivi, tale che:

1. Legge di tricotomia: per ogni x ∈ K, vale una ed una sola delle seguenti alternative:

x = 0, x ∈ P, −x ∈ P.

2. Legge di compatibilita: P + P ⊆ P, P · P ⊆ P.

Nello stesso modo si definisce un corpo ordinato o, ancora piu in generale, un anello ordinato (anchenon commutativo). I risultati che seguono vengono formulati per un corpo (commutativo), ma si estendonofacilmente ad un anello (commutativo o no).

Se x ∈ P , si scrive x > 0. Se −x ∈ P , si scrive x < 0, e si dice che x e negativo. Si introduce in K unarelazione d’ordine totale ≤, assumendo a ≤ b sse a = b oppure a < b, dove a < b significa, per definizione,b− a > 0.

Si dimostrano facilmente le usuali regole delle disuguaglianze e la regola dei segni, secondo la qualeil prodotto di due positivi o di due negativi e positivo mentre il prodotto di un positivo per un negativo enegativo16; da questa si deduce che il quadrato di un qualunque elemento a non nullo e positivo, in quanto:a2 = aa = (−a)(−a). Ne segue che l’unita u = u2 di K e positiva e pertanto nu > 0 per ogni n ∈ N, cosiccheogni campo ordinato K ha caratteristica zero; inoltre e facile verificare che l’isomorfismo tra il campofondamentale di K ed il campo razionale Q e anche un isomorfismo di insiemi ordinati. Si noti che uncampo ordinato non e algebricamente chiuso in quanto il polinomio X2 + u non ha zeri in K (perchex2 + u > 0 per ogni x ∈ K); in altri termini: un campo algebricamente chiuso non e ordinabile; inparticolare il campo complesso non puo essere ordinato.

Ricordiamo che un campo (o piu generalmente un anello) ordinato K dicesi archimedeo se soddisfa laseguente condizione (detta il Postulato di Archimede):

(A) Per ogni a, b ∈ K con a > 0 e b > 0, esiste n ∈ N tale che na > b.

Si osservi che il Postulato di Archimede equivale alla condizione seguente (in cui u denota l’unita di K):

(A’) Per ogni c ∈ K con c > 0, esiste n ∈ N tale che nu > c;

infatti (A) implica ovviamente (A’) (si ponga in (A) a = u, b = c); inoltre (A’) implica (A) (si assumac = b · a−1 e si moltiplichi la disuguaglianza nu > b · a−1 a destra per a ottenendo (nu)a > b · a−1a, ossia

16Questa regola dei segni di un campo ordinato non deve essere confusa con la regola ”piu per piu fa piu, piu per meno fameno, meno per meno fa piu”, che non ha un significato ordinale ma un significato puramente algebrico e che e valida in ognianello A come conseguenza della proprieta distributiva del prodotto rispetto alla somma. Si inizia con dimostrare che lo zeroe fattore nullifico: per ogni a ∈ A si ha a · 0 = 0 perche ab = a(b + 0) = ab + a · 0 ⇒ a · 0 = 0; poi si prova che per ognia, b ∈ A si ha a(−b) = −(ab): infatti 0 = a · 0 = a(b − b) = a(b + (−b)) = ab + a(−b) ⇒ a(−b) = −(ab) (il che prova anche laproprieta distributiva del prodotto rispetto alla ”differenza”); infine si prova che per ogni a, b ∈ A si ha (−a)(−b) = ab: infatti(−a)(−b) = −((−a)b) = −(−(ab)) = ab.

15

na > b.

Esempi. L’anello Z ed i campi Q ed R (ciascuno con l’ordinamento naturale) sono archimedei. Unesempio di campo non archimedeo e il campo R(X) delle funzioni razionali (frazioni algebriche), ordinatoassumendo:

(f(X) ∈ R(X)) f(X) > 0 sse esiste n ∈ N tale che f(x) > 0 per ogni x ∈ R tale che x > n.

In effetti, la (A) non e soddisfatta, ad es. per b = X ed a = u, perche per ogni n ∈ N si ha nu < X, cioeX − nu > 0: infatti x− nu > 0 per ogni x ∈ R tale che x > n.

Si puo dimostrare che (cfr. B. Segre, Lectures on modern geometry, 1961, p. 28):

Teorema 4 Un corpo ordinato archimedeo e necessariamente commutativo, cioe un campo. �

Un campo ordinato archimedeo K dicesi completo se ogni sovracampo ordinato archimedeo H ⊇ K,l’ordinamento del quale conservi l’ordinamento di K, coincide con K.

Teorema 5 Un corpo ordinato archimedeo K e (a meno di isomorfismi) un sottocampo del campo reale R.Si ha dunque: Q ≤ K ≤ R. �

Dimostrazione (Cenni17). Sappiamo che il campo fondamentale di K e Q, quindi Q ≤ K. Utilizzandol’ipotesi che K sia archimedeo, si puo dimostrare che:

(*) se s ∈ K \Q, allora s e il minimo dei maggioranti l’insieme Qs; = {a ∈ Q : a < s}.

Utilizzando la (*) si puo dimostrare che:

(**) se s ∈ K \Q, allora s e definito da una successione di Cauchy di numeri razionali.

La (**) assicura che s ∈ R, perche R e, per definizione, il completamento alla Cauchy di Q. PertantoK ⊆ R. �

Dal Teorema (5) segue evidentemente che:

Teorema 6 (Completezza del campo reale). Il campo reale R e ordinato archimedeo e non e ampliabilepropriamente ad un campo ordinato archimedeo H > R .

Dimostrazione Se un tale sovracampo H esistesse, si avrebbe l’assurdo R < H ≤ R. �

Dai Teoremi (5) e (6) segue evidentemente che:

Teorema 7 (Caratterizzazione del campo reale). Il campo reale R e (a meno di isomorfismi) l’unicocampo ordinato archimedeo completo. �

17Cfr. L. Lombardo-Radice, Dispense del corso di Geometria Superiore, Universita di Roma, 1963, p. 20-24).

16

Osservazione. La (*) non e necessariamente vera per un campo K ordinato non archimedeo, ad esempioper il campo K = R(X), precedentemente considerato. Infatti X ∈ R(X) non e il minimo dei maggiorati di

QX = {a ∈ Q : a < X} = Q

perche ogni razionale a ∈ Q e maggiorato ad esempio da X/2, ed e: a < X/2 < X.

1.6 Sugli assiomi di continuita della retta.

Confronto di segmenti. Siano AB e CD due segmenti qualunque. Sia B′ il punto della semiretta diorigine C contenente D tale che AB ≡ CB′. Diremo che AB e minore di CD (e scriveremo AB < CD) seCB′D.

Versi di percorrenza su una retta. Utilizzando la relazione di intergiacenza tra terne di punti allineatie possibile definire su una retta qualsiasi due versi di percorrenza (tra loro opposti) nel modo seguente. Sianodate su una qualunque retta r due punti distinti P,Q. Definiamo sulla retta r il verso di percorrenza da Pa Q come la relazione < (”precede”) definita tra i punti di r nel modo seguente. Siano anzitutto a e b lesemirette (aperte) di r aventi origine P , e sia b quella che contiene Q. Diciamo allora: che ogni punto di aprecede sia P sia ogni punto di b; che il punto P precede ogni punto di b; che, dati due punti A1, A2 ∈ a,si ha A1 < A2 se A1A2P ; che, dati due punti B1, B2 ∈ b, si ha B1 < B2 se PB1B2. In modo analogo sidefinisce il verso di percorrenza da Q a P .

Classi separate. Sia r una retta sulla quale sia stato fissato un verso di percorrenza. Siano a ed b duesottoinsiemi di r non vuoti e disgiunti. Si dice che (a, b) e una coppia di classi separate di punti di r, seogni punto di a precede ogni punto di b. Un punto P della retta r si chiama un elemento di separazionedi (a, b) se ogni punto di a distinto da P precede P , e se P precede ogni punto di b distinto da P .

Una partizione ordinata (o sezione di Dedekind) della retta r e una coppia (a, b) di classi separatetale che a ∪ b = r; in altri termini (a, b) e una partizione di r in due classi separate. Evidentemente, se unapartizione ordinata (a, b) della retta r ammette un elemento di separazione, questo e necessariamente unico(ed e il massimo di a oppure il minimo di b).

Una coppia di classi contigue di punti della retta r e una coppia (a, b) di classi separate di puntidi r tali che, fissato comunque un segmento EF , esistano un punto A ∈ a ed un punto B ∈ b per i qualiAB < EF . Evidentemente, se una coppia (a, b) di classi contigue ammette un elemento di separazione,questo e necessariamente unico. La proprieta di continuita della retta e stata formulata da Dedekind eda Cantor attraverso due celebri postulati:

Assioma di Dedekind. Per ogni partizione ordinata di una retta qualunque, esiste almeno un elementodi separazione.

Assioma di Cantor. Per ogni coppia di classi contigue di punti di una retta qualunque, esiste almenoun elemento di separazione.

Si puo dimostrare che l’assioma di Dedekind equivale all’assioma di continuita di Hilbert e che ciascunodi essi equivale ai due assiomi di Cantor e di Archimede presi insieme (cfr. L. Berzolari, G. Vivanti, D. Gigli,Enciclopedia delle matematiche elementari). Si ha cioe il teorema:

Teorema 8 Assioma di Dedekind ⇔ (assioma di Cantor ∧ assioma di Archimede) ⇔ assioma della conti-nuita di Hilbert. �

Continuita della retta e numeri reali. Il campo reale e la retta della geometria elementare sonostati qui presentati indipendentemente l’uno dall’altro. D’altra parte, e proprio la proprieta di continuita

17

che permette di stabilire una corrispondenza biunivoca tra i numeri reali x ed i punti P di una retta r sullaquale siano stati fissati un punto O come origine ed un segmento OU come unita di misura: dato un puntoP ∈ r, ad esso si associa il numero reale x(P ) definito come la misura di OP rispetto ad OU ; viceversa, datoun numero reale x, ad esso si associa il punto P = P (x) di r tale che OP abbia misura x rispetto ad OU .

L’assioma di Archimede e sufficiente per associare il numero reale x(P ) al punto P di r: il numero x(P ) –che e la misura di OP rispetto ad OU – si definisce facilmente (senza scomodare Archimede) quando OP edOU sono commensurabili, cioe quando hanno un sottomultiplo comune; quel numero x(P ) si definisce anchequando OP ed OU sono incommensurabili, perche allora, per mezzo del postulato di Archimede, si costruiscenel modo ben noto una coppia (a, b) di due classi contigue di punti, a = (A1, A2, . . . ) e b = (B1, B2, . . . ), dicui il punto assegnato P e l’elemento di separazione e si definisce poi x(P ) come l’elemento di separazionedelle corrispondenti classi contigue di numeri razionali (x(A1), x(A2), . . . ) e (x(B1), x(B2), . . . ), che sono lecosiddette misure per difetto e per eccesso – a meno di un decimo, di un centesimo, ecc. – di OP rispettoad OU .

Inversamente, per associare il punto P (x) di r ad un arbitrario numero reale x, nel caso in cui x siarazionale si procede nel modo ben noto costruendo con riga e compasso il punto P (x) a partire daipunto O e U . Ma se x e irrazionale, e necessario ricorrere all’assioma di continuita della retta, nella formadi Cantor o di Dedekind. Ricordiamo come si procede.

Se il numero irrazionale x viene presentato ad esempio alla Cantor come l’elemento di separazione didue classi contigue di numeri razionali (a1, a2, . . . ) e (b1, b2, . . . ), allora da queste si passa a costruire (con rigae compasso) le due classi contigue di punti corrispondenti sulla retta (A(a1), A(a2), . . . ) e (B(b1), B(b2), . . . );queste ultime determinano (per l’assioma di continuita di Cantor) un punto P di separazione che vieneassunto come il punto P (x) cercato.

Analogamente, se il numero irrazionale x viene presentato come elemento di separazione di una sezionedi Dedekind (a, b) del campo razionale, questa permette di costruire una corrispondente partizione ordinatadella retta (”sezione di Dedekind della retta”) e questa determina (per l’assioma di continuita di Dedekind)un elemento di separazione P che viene assunto come il punto P (x) cercato.

Osservazione didattica. Per chi non conosca affatto i numeri reali, la presentazione di un numeroirrazionale come ”elemento di separazione di due classi contigue di numeri razionali” o come ”elemento diseparazione di una partizione ordinata del campo razionale” potrebbe sembrare artificiosa. Da un punto divista didattico puo pertanto essere conveniente utilizzare la geometria per fare accettare i numeri reali comeenti che sono di fatto nella natura delle cose: si parte dal dato (intuitivo e/o assiomatizzato) della retta dellospazio ordinario e si ”creano” i numeri (interi, razionali e ”irrazionali”) come misure dei segmenti, nel modousuale, come ricordato poc’anzi.

1.7 Sugli assiomi di congruenza.

Alla luce del teorema che caratterizza lo spazio ordinario A3(R) (introdotto con gli assiomi di Hilbert), echiaro come in tale spazio possa poi essere introdotta l’usuale struttura di spazio metrico (con la metricaeuclidea), e quindi la nozione di isometria. Talvolta, nelle esposizioni intuitive della geometria elementare,si assume come primitivo il concetto di movimento rigido e si definiscono poi congruenti due figure(insiemi di punti) se esiste un movimento rigido che porta l’una figura sull’altra. Questa impostazionepotrebbe a prima vista sembrare ingenua e tautologica. D’altra parte e proprio la via che era stata seguitada Giuseppe Peano nei suoi Principi di Geometria (1889), S’intuisce del resto come sia possibile variare gliassiomi di congruenza di Hilbert, traducendoli opportunamente nel linguaggio dei ”movimenti”. Si chiederache e dato un gruppo di biezioni dell’insieme dei punti dello spazio in se, che gode di opportune proprietadi ”transitivita”, ecc. ecc.

18

2 Gli studi sui fondamenti della matematica.

Se Hilbert aveva ricondotto la coerenza della geometria euclidea all’aritmetica, restava pero aperto il problemadella coerenza dell’aritmetica stessa. Hilbert pose esplicitamente questo problema nella sua memorabileconferenza, tenuta durante il Secondo Congresso Internazionale dei Matematici svoltosi a Parigi nel 1900,nella quale attiro l’attenzione della comunita matematica su 23 importanti problemi, come argomenti fon-damentali da affrontare nel corso del secolo che stava iniziando18.

Gli assiomi di Peano non risolvono il problema della coerenza dell’aritmetica, perche non e possibiledimostrare che essi non conducano ad una contraddizione. D’altra parte riflettendo sui numeri naturali0, 1, 2, . . . i matematici della fine del 1800 sono stati naturalmente portati alla nozione di insieme. La teoriadegli insiemi sorse ad opera di Georg Cantor, proprio come teoria dei numeri cardinali : la numerosita (opotenza) di un insieme viene definita come classe (di equivalenza) costituita dagli insiemi ponibili in cor-rispondenza biunivoca con l’insieme dato. Accanto alla teoria dei numeri cardinali, Cantor ha sviluppatoanche una teoria dei numeri ordinali, che - per dirla in modo approssimativo - indicano la numerosita di uninsieme ben ordinato: il numero ordinale degli elementi di un insieme ben ordinato e definito come classe degliinsiemi (ben) ordinati ponibili con l’insieme dato in corrispondenza biunivoca che ne conservi l’ordinamento.Un insieme e infinito se puo essere posto in corrispondenza biunivoca con una sua parte propria. In talmodo il concetto di infinito (che era in precedenza definito in modo rigoroso solo come infinito potenziale)entra a far parte del pensiero matematico come infinito attuale. Per un insieme finito il numero cardinaleconcide con il suo numero ordinale (e si identifica con un numero naturale); per gli insiemi infiniti cosı non e,e Cantor perviene ad una teoria degli insiemi infiniti e ad una corrispondente aritmetica dei cardinali(e ordinali) infiniti.

Tra i piu duri avversari della teoria degli insiemi ricordiamo Leopold KRONECKER (1823-1891), FelixKLEIN, Henri POINCARE(1854-1912), che Arrivo a dire che la teoria degli insiemi e un interessante casopatologico e predisse che i posteri considereranno la teoria degli insiemi di Cantor come una malattia da cuisi e guariti. D’altra parte Hilbert nel 1926 disse: Nessuno riuscira a cacciarci dal paradiso che Cantor hacreato per noi ed egli come Bertand Russell considero l’opera di Cantor come una delle piu belle realizzazionedel pensiero matematico19.

Il tentativo di fondare in modo rigoroso l’aritmetica sulla teoria degli insiemi sposto il problema a quellodi trovare una formulazione assiomatica della teoria degli insiemi che potesse dare garanzie di noncontraddittorieta. A tal fine era necessario indagare sulla stessa logica, con la quale si sviluppavano le teoriematematiche, trovare insomma una base assiomatica per la logica stessa. Il problema dei fondamentidell’aritmetica e della teoria degli insiemi diviene cosı il problema dei fondamenti della matematicanel suo complesso e del ruolo della logica in matematica, problemi questi che erano venuti in mododrammatico alla ribalta con la scoperta di alcune contraddizioni, chiamate eufemisticamente paradossi,soprattutto nell’ambito della teoria degli insiemi. Ricordiamo alcuni paradossi tra i piu noti.

Paradosso di Burali-Forti (Cesare Burali-Forte, 1897): La collezione degli ordinali non e un insieme:la successione di tutti i numeri ordinali e ”ben ordinata e pertanto dovrebbe avere come ordinale il piu grandedi tutti i numeri ordinali.

Paradosso di Richard (Jules Richard, 1905): L’insieme A dei numeri interi positivi che possono esseredescritti a parole con al piu 100 lettere dell’alfabeto e non vuoto (contiene ad esempio: settantadue, noveper nove, ecc.) ed e finito perche usando le 26 lettere dell’alfabeto si possono formare al piu 26100 espressioni

18Il secondo problema di Hilbert era precisamente: Studiare l’indipendenza e la non contraddittorieta degli assiomidell’aritmetica. Per un esame sullo stato attuale delle ricerche originate dallo studio dei ”Problemi di Hilbert”, cfr. J. Gray, Wemust know, we shall know: a history of the Hilbert problems. Oxford Univ. Press, 2000. Si veda anche: Il pensiero di DavidHilbert a cento anni dai ”Grundlagen der Geometrie”, Suppl. n.1, vol. 55 della rivista ”Le Matematiche”, Catania 2000. Cisi limita qui a ricordare che Paul COHEN (1934- ) ha risolto nel 1963 il Primo Problema di Hilbert consistente nel dimostrarel’ipotesi del continuo, dovuta a Cantor, secondo cui non esiste alcun cardinale intermedio tra la potenza del numerabile e quelladel continuo. La soluzione di Cohen e nel senso che il suddetto enunciato e indecidibile nel sistema di assiomi della teoria degliinsiemi di Zermelo-Fraenkel, cioe ne quell’enunciato ne la sua negazione sono teoremi della teoria. Pertanto, se la teoria degliinsiemi di Zermelo-Fraenkel e non contraddittoria, allora la teoria stessa resta non contraddittoria aggregandole come assiomal’ipotesi del continuo o la sua negazione.

19Il Lettore riveda al riguardo la dimostrazione delle seguenti affermazioni. 1: N e infinito. 2: | N |=| Q | . 3: L’intervalloaperto reale ]0, 1[ e equipotente ad R. 4: | N |<| R |. 5: | A |<| P (A) | per ogni insieme A.

19

con al piu 100 lettere (e molte di quelle espressioni non sono dotate di significato); sia B linsieme dei restantinumeri interi (quelli la cui descrizione richiede almeno 101 lettere). Anche B e non vuoto per quanto detto.Sia b l’intero definito come il piu piccolo numero di B. Dunque il piu piccolo intero non descrivibile con alpiu 100 lettere puo invece essere definito con meno di 100 lettere.

Paradosso del barbiere (Bertrand Russell, 1918): Il barbiere di un piccolo villaggio non fa la barbaa coloro che si radono da soli, ma la fa a tutti quelli che non si radono da soli. Un giorno il barbiere sidomanda se dovrebbe o no radere se stesso. Se sı, allora no; se no, allora sı.

Paradosso di Cantor: parlare di ”insieme di tutti gli insiemi” conduce ad una contraddizione. L’insiemedegli insiemi che non contengono se stesso come elemento contiene se stesso come elemento? Se sı, allora no;se no, allora sı.

Russell ha notato che la causa di questi paradossi consiste nel definire un oggetto in termini di una classedi oggetti che contiene l’oggetto stesso (definizione impredicativa). Ernst ZERMELO (1871-1953) ha osser-vato nel 1908 che la definizione di estremo inferiore di un insieme di numeri e impredicativa e che quindil’analisi classica contiene dei paradossi.

Per superare i paradossi, i matematici sostituirono alla teoria ingenua degli insiemi quale era stata elab-orata da Cantor, altre teorie degli insiemi, di tipo assiomatico. Nasce cosı il sistema assiomatico di ErnstZermelo (1908), poi modificato da Abraham A. FRAENKEL (1921) (sistema ZF o di Zermelo-Fraenkel)e da J. von NEUMANN (1903-1957) nel 1925. Con queste teorie formali si sviluppa tutta la teoria degliinsiemi necessaria all’analisi e si evitano i paradossi (o almeno non sono stati trovati). Ma riguardo al prob-lema della coerenza, divenuto ormai cruciale, Poincare osservava pessimisticamente: ”Abbiamo messo unrecinto intorno al gregge per proteggerlo dai lupi, ma non sappiamo se ci fossero gia dei lupi nel gregge” 20.

Secondo i critici, i sistemi assiomatici proposti avevano il difetto di presupporre l’uso della logica, proprioin un momento in cui era la logica stessa e la sua relazione con la matematica a dover essere investigata.

All’inizio del Novecento tre grandi scuole di pensiero affrontatarono in modo netto la questione filosoficadei fondamenti della matematica: la scuola logicista (Russell e Whitehead), la scuola intuizionista(Brouwer) e la scuola formalista (Hilbert). Una svolta decisiva viene segnata dai teoremi di Godel, chein qualche modo pongono un limite al problema della coerenza, e contribuirono ad indirizzare la filosofia dellamatematica verso altre problematiche. E in questo quadro rinnovato che sorge una scuola strutturalista(Nicolas BOURBAKI).

Ancora sul buon ordinamento e su questioni collegate. Ritorniamo sulla nozione di buon or-dinamento, nominata a proposito di quella di numero ordinale. Ricordiamo anzitutto alcune definizioniriguardanti gli insiemi parzialmente ordinati.

Un insieme X si dice parzialmente ordinato (o poset) se e dotato di una relazione di ordine, ossia diuna relazione riflessiva, antisimmetrica, e transitiva. La relazione d’ordine si denota comunemente con ≤,cosicche (X,≤) e la notazione per il poset considerato. Un poset (X,≤) si dice totalmente ordinato (olinearmente ordinato o una catena) se, dati comunque due suoi elementi x ed y, risulta necessariamentex ≤ y oppure y ≤ x.

Un poset (X,≤) si dice bene ordinato se ogni sua parte non vuota ha un minimo. Ad esempiol’ordinamento secondo grandezza e un buon ordinamento in N, ma non in Z, ne in Q ne in R.

Un poset (X,≤) si dice induttivo se ogni sua catena Y e maggiorata in X. Ad esempio risulta induttivoil poset degli ideali propri di un anello con unita rispetto all’inclusione; risulta induttivo il poset G(a, b)delle catene di estremi a e b di un poset X; non risulta induttivo l’insieme dei naturali (o dei reali) ordinatosecondo grandezza.

Un elemento z di un poset (X,≤) dicesi massimale se: (x ∈ X, z ≤ x) ⇒ x = z.Si puo dimostrare che le proprieta espresse dai seguenti quattro assiomi (o teoremi) sono equivalenti,

e che la loro aggiunta ad un sistema di assiomi della teoria degli insiemi non ne altera il carattere di noncontraddittorieta.

Lemma di Zorn (Max Zorn, 1906 – ) Ogni insieme induttivo possiede un elemento massimale.

20Cfr. Morris Kline, Storia del pensiero matematico, vol. II, Einaudi, 1991, p. 1382.

20

Assioma di Zermelo (Ernst Zermelo, 1871–1953). Ogni insieme puo essere bene ordinato.

Assioma della scelta. Per ogni insieme E non vuoto esiste almeno una funzione di scelta su E, ossiaun’applicazione F : P ∗(E) → E, dall’insieme P ∗(E) delle parti non vuote di E ad E tale che: A ∈ P ∗(E) ⇒F (A) ∈ A.

Proprieta di Tarski (1924) (Alfred Tarski, 1901 – 1983). Per ogni numero cardinale infinito c risultac = c2.

Si noti che:(a) non si conosce esplicitamente una funzione di scelta su R, mentre su N si puo assumere F (A) = min(A)per ogni A ∈ P ∗(N).(b) non si conosce un buon ordinamento di R. Un buon ordinamento di N e quello naturale; questo induce(determina) un buon ordinamento in ogni insieme posto in corrispondenza biunivoca con N, in particolarein Z e in Q21.

2.1 La scuola logicista.

Il precedente storico immediato della scuola logicista di Russell e Whitehead era stata la matematizzazionedella logica, che ebbe inizio nel XIX secolo con Augustus DE MORGAN che aveva formulato (nel 1847) lefamose leggi che portano il suo nome:

¬(p ∨ q) ' (¬p) ∧ (¬q), ¬(p ∧ q) ' (¬p) ∨ (¬q)

e che nel linguaggio della teoria degli insiemi si enunciano dicendo che ”il complementare dell’unione el’intersezione dei complementari” e che ”il complementare dell’intersezione e l’unione dei complementari”:

CE(A ∪B) = CE(A) ∩ CE(A), CE(A ∩B) = CE(A) ∪ CE(A).

Nello stesso periodo George BOOLE aveva sviluppato una logica estensionale cioe una logica delle classi,giungendo alla assiomatizzazione di quella che oggi viene chiamata un’algebra di Boole, cioe un reticoloR(≤,∩,∪) con massimo e minimo, distributivo e complementato. L’opera di De Morgan e di Boole porto adun effettivo sviluppo della logica aristotelica ed ebbe come conseguenza il distacco della logica dalla filosofiaed il suo inserimento nella matematica: nasceva la logica matematica.

Fu Charles S. PEIRCE ad introdurre la distinzione tra una proposizione ove intervengono solo costanti(”Mario e un uomo”) ed una funzione proposizionale di una o piu variabili (”x e un uomo”, ”x conoscey”, ecc.).

La logica matematica fu dunque una matematizzazione della logica; essa ebbe come insigni rappresentantiGiuseppe PEANO in Italia e Gottlob FREGE in Germania. Quest’ultimo indico una fondazione assiomaticadella logica (Ideografia, 1879) ed utilizzo la sua logica per i Fondamenti dell’aritmetica (1884), con ilproposito di costruire la matematica come una estensione della logica. La scuola logicista (che,come detto, si puo fare risalire a Frege) trovo i suoi massimi rappresentatnti in Bertrand RUSSELL e AlfredNorth WHITEHEAD, che pubblicarono i Principles of Mathematics (1903) e poi i Principia Mathematica(3 voll., 1910–1913). Essi assumono come primitive le nozioni di proposizione elementare p, q, . . . e difunzione proposizionale p(x), affermazione di verita di una proposizione elementare, la negazione ¬p di unaproposizione e la disgiunzione p∨q di due proposizioni; su questa base viene da loro costruita tutta la logica.Ad esempio l’implicazione p ⇒ q, da loro scritta alla Peano come p ⊃ q, e definita da ¬p ∨ q e vengonoformulati vari postulati, tra i quali ad esempio:

21Ricordiamo che si costruisce una bijeezione α : N → Q con il metodo di Cantor disponendo i numeri di Q in una matriceinfinita e ponendo n/m ∈ Q nella casella di posto (n, m); tralasciando i numeri gia considerati, si dispongono in una successionele coppie (n, m) seguendo l’ordine α(1) = (1, 1), α(2) = (2, 1), α(3) = (1, 2), α(4) = (3, 1), . . . , ecc. Per ottenere il buonordinamento di Q si ’incolla’ tramite α il buon ordinamento di N su Q. Si noti che, come e evidente a priori, il buon ordinamentocosı ottenuto su Q non e l’ordinamento usuale di Q.

21

1) (p ∨ p) ⊃ p, 2) q ⊃ (p ∨ q),3) (p ∨ q) ⊃ (q ∨ p), 4) [p ∨ (q ∨ r)] ⊃ [q ∨ (p ∨ r)].

Dai loro postulati, Russell e Whitehead deducono vari teoremi di logica — ad esempio (p ⊃ ¬p) ⊃ ¬p (la”riduzione all’assurdo”), p ∨ ¬p (il ”principio del terzo escluso”), ecc. — ed infine teoremi di aritmeticae di analisi . Gli insiemi vengono introdotti per mezzo di funzioni proposizionali, cosı p(x) indical’insieme di tutti gli oggetti per i quali p(x) e vera. Viene quindi sviluppata una teoria dei tipi: unafunzione proposizionale e di tipo zero se si applica a membri x che sono singoli oggetti, di tipo 1 se siapplica a membri x che sono funzioni proposizionali di tipo 0, di tipo n+1 se si applica a membri x che sonofunzioni proposizionali di tipo n. La teoria dei tipi cerca di evitare i paradossi della teoria degli insiemi, inparticolare evitando le definizioni impredicative, ossia imponendo che cio che viene definito utilizzandotutti i membri di una collezione non debba essere membro della collezione medesima.

Un nuovo definitivo passo in avanti fu compiuto da GODEL. Egli dimostro nel 1935 che non e possibilestabilire la coerenza della teoria dei numeri qualora ci si limiti alla logica della metamatematica. HermannWEYL commento questo risultato dicendo che Dio esiste perche la matematica e coerente ed il diavolo esisteperche non possiamo dimostrArne la coerenza.

Russell e Whitehead sviluppano poi una teoria delle classi, ove per classe s’intende la totalita deglioggetti che soddisfano una determinata proprieta; gli insiemi sono classi ma non viceversa; una classepropria e una classe che non e un insieme: le classi hanno la caratteristica di non poter essereelemento di altre classi. Sono esempi di classi proprie: la classe di tutti gli ordinali, la classe di tuttigli insiemi, la classe degli insiemi che non contengono se stessi come elemento; se queste classifossero insiemi condurrebbero ad una contraddizione.

Le relazioni (binarie) sono classi di coppie che verificano una funzione proposizionale di due variabili. Sidefinisce poi22 la nozione di corrispondenza biunivoca tra classi, che conduce alla definizione di numerocardinale (la classe delle classi ponibili in corrispondenza biunivoca con una classe data). Dai numericardinali, si passa poi ai numeri naturali, e quindi ai razionali, ai reali, ai complessi, alle funzioni, efinalmente a tutta l’analisi e alla geometria euclidea. In tal modo la scuola logicista intendeva assolvereal programma di fondare tutta la matematica sulla logica.

Merito di Russell e Whitehead e della scuola logicista e stato indubbiamente quello di aver fondato unalogica espressa su base assiomatica ed in forma interamente simbolica, contribuendo cosı in modosostanziale alla sviluppo e alla diffusione della logica matematica. Tuttavia a prescindere da alcune critichedi carattere tecnico, e stato messo in evidenza la difficolta ad aderire fideisticamente ad una filosofia dellamatematica in base alla quale tutta la matematica sarebbe una scienza puramente formale, logico-deduttiva, in cui i teoremi seguono dalle leggi del pensiero, prescindendo non solo dalla intuizione masoprattutto dall’esperienza fisica.

2.2 La scuola intuizionista.

L’origine di questa filosofia della matematica si puo fare risalire a KRONECKER, che aveva fortementeavversato la teoria degli insiemi di Cantor come ”puro misticismo” ed aveva auspicato una fondazione dellamatematica sui numeri interi (”creati da Dio”), ottenuta introducendo tutti gli enti matematici con metodicostruttivi e con un numero finito di passi; in particolare egli rifiutava i numeri irrazionali, considerati ”nonesistenti”. La filosofia intuizionista prese vigore con la scoperta dei paradossi, e trovo un suo primo grandepropugnatore in Henri POINCARE(1954-1912), che avverso la teoria degli insiemi e soprattutto la filosofiadel logicismo, che secondo lui rischiava di ridurre tutta la matematica ad una colossale tautologia. Poincareriteneva che tutte le definizioni dovessero essere costruttive e percio rifiutava l’assioma della scelta;egli affermava che l’aritmetica non puo essere fondata assiomaticamente, ma costituisce un a priori

22E da notare che la nozione di corrispondenza biunivoca non presuppone il numero 1 (altrimenti si otterrebbe un circolovizioso): una corrispondenza tra la classe A e la classe B e definita come una data classe C di coppie (a, b) con a ∈ A e b ∈ B;la corrispondenza C e biunivoca se: 1) per ogni a ∈ A esiste qualche b ∈ B per cui (a, b) ∈ C; 2) per ogni b ∈ B esiste qualchea ∈ A per cui (a, b) ∈ C; 3) se (a, b) e (a, b′) sono in C, allora b = b′; 4) se (a, b) e (a′, b) sono in C, allora a = a′.

22

della nostra intuizione, come lo e l’induzione matematica. Simili affermazioni vennero sporadicamentefatte da altri eminenti matematici quali Emile BOREL (1871–1956), Rene BAIRE (1874–1932), JacquesHADAMARD (1865–1963) e Henri LEBESGUE (1875-1941), ma fu Luitzen BROUWER (1881–1966) chesviluppo sistematicamente tali idee, tanto da poter essere considerato il fondatore della scuola intuizionistica,che fra l’altro rifiutava il principio del terzo escluso e le dimostrazioni per assurdo. Tale scuola, allaquale aderı, per molti versi, anche Hermann WEYL, non si limito alla critica del logicismo, ma ricostruı unanuova matematica basata sulle costruzioni finitiste ritenute accettabili. Si noti che questa filosofiadella matematica propugnata dalla scuola intuizionista treva un suo corrispettivo nella filosofia del sensocomune di Henri BERGSON e di altri.

2.3 La scuola formalista.

A capo di questa scuola troviamo HILBERT, che, dopo aver ricondotto la coerenza della geometria euclideaa quella dell’aritmetica, si volse nel 1904 al problema di fondare assiomaticamente l’aritmetica senzala teoria degli insiemi dimostrandone poi la coerenza. Si tratta del cosı detto programma hilber-tiano, al quale egli si dedico intensamente a partire dal 1920 e che raccolse il consenso di molti matematici.Le idee fondamentali dei formalisti si possono riassumere nei termini seguenti. Poiche la fondazione dellamatematica deve tener conto della logica, bisogna trattare contemporaneamente la logica e la mate-matica; di piu, poiche la matematica e costituita da vari discipline, bisogna che ogni disciplina abbia unasua propria fondazione assiomatica, costituita da concetti e principi sia logici sia matematici; ed ancora:la logica e un linguaggio fatto di segni che traduce gli enunciati in formule ed esprime i ragionamentiper mezzo di procedimenti puramente formali. Gli assiomi forniscono le regole con cui certeformule derivano da altre formule. I segni ed i simboli di queste operazioni ed i simboli matematicisono svuotati da ogni significato.

Secondo questa concezione, l’essenza della matematica sono i simboli, che non vanno intesi come idealiz-zazioni di oggetti fisici. La matematica diventa un insieme di sistemi formali, ciascuno con propri concetti,propri assiomi, proprie formule ben formate, e proprie regole di deduzione. Per alcuni sistemi formalimolto semplici, Hilbert e la sua scuola (W. Ackermann, P. Bernays (1888–1972), J. von Neumann (1903–1957) riuscirono a dimostrare la coerenza, ma al programma di dimostrare la coerenza dell’aritmeticainfersero un colpo definitivo i risultati di Kurt Godel (1931), dai quali discendeva che nessun sistemaformale puo contenere una qualsiasi branca significativa della matematica, perche ogni tale sistema formalee incompleto ossia contiene enunciati, i cui concetti appartengono al sistema, che non possono peroessere dimostrati all’interno del sistema stesso. Tuttavia, nonostante il suo fallimento, il programma diHilbert lascio una notevole eredita di risultati metamatematici riguardanti la teoria della dimostrazione,consentendo infine di pervenire alla concezione moderna secondo cui l’attivita matematica consiste essen-zialmente nella dimostrazione di teoremi, la cui esecuzione prescinde dai contenuti specifici dellesingole teorie 23.

2.4 La critica di Godel.

Come gia accennato, il programma formalista di Hilbert consisteva nel tentativo di dimostrare la co-erenza della teoria formale dell’aritmetica (cioe dei numeri naturali) utilizzando metodi finitisti ed all’internodi una teoria che comprendesse sia i termini e le regole logiche di deduzione formale sia i termini dell’aritmetica.

Realizzare questo programma e impossibile, in quanto sussiste il secondo teorema di incompletezzadi Godel, che ha inferto un colpo fatale al programma stesso. Accenniamo brevemente di cosa si tratta,ricordando altri due fondamentali teoremi dello stesso Kurt GODEL (1906-1978).

Teorema di completezza di Godel. Una formula che sia realizzata in tutti i modelli di una teoria23Cfr. D. Palladino e C. Palladino, Breve dizionario di logica, carocci, 2005, p. 45-46.

23

del primo ordine e dimostrabile in tale teoria. In altri termini, per una qualunque teoria del prim’ordine,una formula e dimostrabile se e soltanto se e valida (cioe in tale teoria i teoremi coincidono con le formulevalide).

Primo teorema d’incompletezza di Godel. Se una teoria formale dell’aritmetica e non contrad-dittoria, esiste una formula F della teoria tale che ne F ne non− F sono dimostrabili nella teoria. In altritermini, se una teoria formale dell’aritmetica e non contraddittoria, essa non e una teoria completa.

Secondo teorema d’incompletezza di Godel. Se una teoria formale dell’aritmetica e non contraddit-toria, non e possibile dimostrare la sua non–contraddittorieta con metodi formalizzabili all’interno di quellateoria.

Un altro importante teorema di Godel (1940) riguarda l’ipotesi del continuo; questa ipotesi afferma lanon esistenza di cardinali intermedi tra il numerabile ed il continuo. Il risultato di Godel e il seguente:

Teorema. Se la teoria degli insiemi e non contraddittoria, si puo aggiungere ai suoi assiomi l’ipotesi delcontinuo.

Questo risultato e migliorato da un celebre teorema di Paul Cohen (1934–) gia citato, dal quale seguel’indipendenza dell’ipotesi del continuo dagli assiomi della teoria ZF degli insiemi, in quanto afferma che:

Teorema di Cohen (1963). Se la teoria degli insiemi di Zermelo-Fraenkel e non contraddittoria, si puoaggiungere ai suoi assiomi tanto l’ipotesi del continuo quanto la sua negazione.

Lo stesso Cohen ha dimostrato (1963) un analogo risultato per quanto riguarda l’assioma della scelta.Egli ha inoltre dimostrato che anche aggiungendo l’assioma della scelta al sistema di Zermelo-Fraenckel,l’ipotesi del continuo non puo essere dimostrata.

2.5 La scuola strutturalista.

Un tentativo di rifondare il complesso della matematica moderna su basi assiomatiche e stato compiuto daun gruppo di matematici francesi (Henri cartan, Claude Chevalley, Jean Dieudonne, Andre Weil) che si sonoraccolti sotto lo pseudonimo collettivo di Nicolas Bourbaki, dal nome di un generale di Napoleone III.

Il gruppo, fondato nel 1933, comincio a operare nel 1939 e si e continuamente rinnovato nella composizione,in quanto vi vige la regola ferrea che i suoi membri vengono espulsi al compiere del quarantesimo anno.Bourbaki ha pubblicato un trattato in piu volumi dal titolo Elementes des Mathematiques, che e diventatoun’opera fondamentale di riferimento per i matematici; esso prende le mosse dalla teoria degli insiemied articola poi l’esposizione della matematica secondo le varie strutture presenti (algebriche, d’ordine,topologiche, ecc.).

Si noti che in ogni campo (filosofia, sociologia, antropologia, psicanalisi, teoria del linguaggio, ecc.) lostrutturalismo privilegia le relazioni che intercorrono tra gli oggetti che vengono studiati; basti pensarealle opere del grande antropologo Claude Levi-Strauss.

Tra i meriti storici del gruppo bourbakista c’e quello di aver diffuso tra i matematici di tutto il mondoun linguaggio comune e notazioni di tipo standard e che in gran parte si rifanno a quelle introdotte daGiuseppe Peano. Il gruppo e ancora attivo sotto forma di Seminaire Bourbaki di cui pubblica annualmentedei Rendiconti.

24

2.6 Conclusione.

Per concludere, si puo dire che siano tutti falliti i tentativi di trovare una soluzione definitiva al problemadi stabilire dei fondamenti certi della matematica, risolvendo in modo soddisfacente il problema della suacoerenza. Per ironia della sorte, dopo tante ricerche, si e tornati, soprattutto con le moderne concezioniproprie dell’intuizionismo, alla posizione che avevano inizialmente i matematici greci, che si affidavanofondamentalmente alla intuizione, ai metodi costruttivi e finitistici.

Forse e addirittura sbagliato pensare che si possa trovare una soluzione definitiva al problema di cosa debbaessere e come debba essere organizzata la matematica; forse la matematica si evolve storicamente,come le arti figurative, come la musica, trovando nelle varie epoche la sua propria fisionomia e la suapropria giustificazione in relazione alla evoluzione della filosofia, delle altre scienze e della tecnica.

Chiudiamo questa esposizione con le parole di Poincare, secondo cui:

. . . la vera matematica, quella che serve a qualche utile scopo, puo continuare a svilupparsi secondo i propriprincipi, senza prestare alcuna attenzione alle tempeste che infuriano intorno a lei, e proseguira passo dopopasso le sue consuete conquiste, che sono definitive e che non sara mai necessario abbandonare24.

3 Un tributo ad Euclide: costruzioni con riga e compasso, i numerieuclidei e i problemi impossibili dell’antichita

Ricordiamo che il primo ed il terzo postulato di Euclde assicurano rispettivamente ”che si possa condurreuna retta da un qualsiasi punto ad ogni altro punto” e che ”si possa descrivere un cerchio con qualsiasicentro e ogni distanza”. Questi due postulati affermano la possibilita di ”costruire” la retta per due puntie la circonferenza di dato centro e raggio. Gli strumenti che permettono materialmente di effettuare questecostruzioni sono la riga e il compasso. Si intende che la riga non e graduata. In altri termini la riga permettesoltanto di tracciare la retta per due punti dati, mentre il compasso permette di tracciare la circonferenzache abbia un dato punto come centro ed un dato segmento come raggio. I greci prediligevano la linea rettae la circonferenza, forse anche a causa della loro particolare bellezza e semplicita rispetto ad altre curve. Ilvolere limitare i metodi di costruzione geometrica all’uso della riga e del compasso rispondeva alla esigenzadi ridurre ogni problema, per quanto complicato, ad elementi che fossero il piu possibile ’semplici’.

Se A e B sono due punti distinti, denotiamo con lo stesso simbolo AB sia la retta per questi due puntiche il segmento con questi due estremi; e denotiamo con C(O, AB) la circonferenza di centro il punto O eraggio AB. Procediamo ricordando anzitutto come con l’uso della riga e del compasso si possono effettuarealcune costruzioni geometriche ed alcune operazioni algebriche, per poi esaminare le ragioni profondeper le quali alcune costruzioni sono possibili ed altre impossibili: un bell’esempio di matematicache riflette su se stessa.

COSTRUZIONI GEOMETRICHE ELEMENTARI CON RIGA E COMPASSO

Ne ricordiamo alcune.Asse di un segmento AB: e la retta MN dove {M,N} = C(A,AB) ∩ C(B,AB).Bisettrice di un angolo AOB = ab: e l’asse del segmento AB′ dove {A} = C(O,OA) ∩ a e {B′} =C(O,OA) ∩ b.Perpendicolare per un punto P ad una retta a: e l’asse del segmento AB dove {A,B} := a ∩ C(P,MN) eMN e un segmento arbitrario (grande quanto basta affinche quella intersezione non sia vuota).Parallela per un punto Pad una retta a: e la perpendicolare per P alla retta perpendicolare per P ad a.

24H. Poincare. The foundation of science, 1946, p. 480.

25

Supponiamo anche note le seguenti altre costruzioni con riga e compasso:Dividere un segmento AB in n parti uguali: si usi il Teorema di Talete.Inscrivere in una circonferenza un n−gono regolare, per n = 3, 4, 5, 6, 8.

Particolarmente interessante – per contrapposizione all’analogo probema della quadratura del cerchio, dicui si dira tra breve – appare la costruzione seguente.

Quadratura di un poligono convesso assegnato. Si tratta di costruire con riga e compasso unquadrato avente la stessa area di un assegnato poligono convesso P = P1P2 . . . Pn. Si procede in quattropassi:

1) Costruzione di un triangolo T equivalente a P. Se n > 3, costruiamo anzitutto un poligono conn − 1 lati ed equivalente al poligono dato: si traccia la diagonale P1P3, e poi la parallela per il punto P2

a tale diagonale, fino ad incontrare – diciamo in un punto P ′2 – il prolungamento del lato P4P3. I triangoli

P1P2P3 e P1P′2P3 sono equivalenti (hanno la stessa base P1P3 e la stessa altezza, che e l’ampiezza della

striscia compresa tra le due rette parallele P1P3 e P2P′2). Sostituendo il triangolo P1P2P3 con il triangolo

P1P′2P3 si ottiene un poligono con n− 1 lati equivalente a P . Iterando il procedimento si giunge a costruire

un triangolo T equivalente a P.2) Costruzione di un parallelogramma P’ equivalente ad un triangolo T = ABC. Sia M il punto

medio di AC e sia N il punto di intersezione tra la parallela per M ad AB e la parallela per B ad AC. Ilparallelogramma P’ = ABMN e il triangolo T sono equivalenti perche sono composti da poligoni congruenti.

3) Costruzione di un rettangolo R equivalente ad un parallelogramma P’ = ABMN . Si costruscano leperpendicolari per A e per B ad AB e si considerino le loro intersezioni A′ e B′ con MN . Allora il rettangoloR = ABB′A′ e il parallelogramma P’ sono equivalenti perche somme o differenze di poligoni congruenti.

4) Costruzione di un quadrato Q equivalente ad un rettangolo R = ABB′A′. Il lato del quadrato Q emedio proporzionale tra AB e AB′ e pertanto si costruisce come altezza di un triangolo rettangolo aventecome proiezioni dei cateti sull’ipotenusa segmenti conguenti ad AB e ad AB′.

OPERAZIONI ELEMENTARI CON RIGA E COMPASSOCostruzione dei punti P (a± b), P (ab), P (a/b), P (

√a):

Sia fissato nel piano un riferimento cartesiano ortogonale monometrico. Siano dati il punto origine O(0, 0),ed i punti unita U1(1, 0), U2(0, 1) dei due assi. Dati sull’asse delle ascisse i punti A(a) e B(b), si possonocostruire con riga e compasso, i punti seguenti:P (a± b): in modo ovvio.P (ab) e il punto in cui l’asse delle ascisse incontra la parallela per il punto (0, b) alla retta (0, 1)(a, 0) (per ilTeorema di Talete).P ( 1

a ): si considera un triangolo rettangolo con altezza 1 relativa alla ipotenusa e proiezione a di un catetorelativo alla ipotenusa; allora 1

a e la proiezione dell’altro cateto sull’ipotenusa.P (a

b ): e il punto P(a· 1b ).P ( a

n ) con n ∈ N : si utilizza il Teorema di Talete per la divisione di un segmento in n parti uguali.P (√

a: il numero√

a e l’altezza relativa alla ipotenusa di un triangolo rettangolo con proiezioni 1 e a deicateti sull’ipotenusa.

PUNTI COSTRUIBILI CON RIGA E COMPASSOA PARTIRE DA UN INSIEME ASSEGNATO DI PUNTI

Sia fissato nel piano un riferimento cartesiano ortogonale monometrico. Sia inoltre assegnato nel pianoun insieme finito P di k ≥ 3 punti. A partire dai punti di P possiamo considerare due tipi di costruzioni:

26

Costruzioni di primo tipo: Costruzione dell’insieme R(P) delle rette congiungenti due punti distintiarbitrari di P. (Si noti che | R(P)|≤ k(k − 1)/2.)

Costruzioni di secondo tipo: Costruzione dell’insieme C(P) delle circonferenze di centro un puntoarbitrario di P e raggio uguale al segmento di estremi due punti arbitrari di P. (Si noti che si dispone di kscelte per il centro e di h ≤ k(k − 1)/2 scelte per il raggio, scelte che conducono a kh circonferenze.)

Definizione 9 I punti del piano costruibili in un passo (con riga e compasso) a partire da P, sono ipunti intersezione di due oggetti di R(P)∪C(P), ossia di due rette, oppure di una retta e di una circonferenzaoppure di due circonferenze tracciate eseguendo una costruzione di primo e di secondo tipo.

Definizione 10 Un punto P del piano si dice costruibile (con riga e compasso) a partire da P, se esisteuna successione finita di punti del piano: P1, . . . , Pn = P tali che:

1) P1 e costruibile in un passo da P,2) per ogni i = 2, . . . , n, si ha che Pi e costruibile in un passo da P ∪ {P1, . . . , Pi−1}.

Definizione 11 Le coordinate a e b di un punto costruibile (con riga e compasso a partire da P) si dicononumeri costruibili (con riga e compasso a partire da P).

Al problema di trovare una condizione necessaria affinche un punto (un numero) sia costruibile con riga ecompasso a partire da P risponde il seguente Teorema di Pierre Laurent WANTZEL (1814-1848).

Teorema 12 Sia dato un insieme finito P di punti del piano euclideo nel quale sia fissato un riferimentocartesiano ortogonale monometrico e sia K0 il campo generato dalle coordinate dei punti di P ossia ilminimo sottocampo di R che contiene le coordinate di tali punti.

Se un punto P (a, b) e costruibile (con riga e compasso a partire da P), allora ciascuna delle sue coordinatee un numero algebrico su K0 di grado una potenza di due, cioe e radice di un polinomio di K0[X]ivi irriducibile e di grado una potenza di due.

Se in particolare K0 = Q, i numeri costruibili si chiamano numeri euclidei, e sono precisamente numerialgebrici di grado una potenza di due.

Dimostrazione25. Sia P un punto costruibile a partire da P, Consideriamo una sequenza di insiemi dipunti che indica una costruzione di P :

P ⊂ P ∪ {P1} ⊂ · · · ⊂ P ∪ {P1, . . . , Pn = P}

e consideriamo la sequenza dei campi associati a questi insiemi di punti:

K0 ≤ K1 ≤ . . . ≤ Kn,

dove cioe Ki e il campo generato dalle coordinate di P ∪ {P1, . . . , Pi}.Si noti che congiungere due punti od intersecare due rette non fa uscire dal campo di razionalita

degli enti assegnati, mentre invece intersecare una retta ed una circonferenza oppure due circonferenze fraloro puo eventualmente fare uscire dal campo di razionalita degli enti assegnati conducendo ad un campoestensione quadratica di quello:

25La dimostrazione del Teorema di Wantzel e assai istruttiva perche consiste in una semplice riflessione sul tipo di calcoliche si compiono nel risolvere i piu semplici problemi di geometria analitica: retta per due punti, intersezione di due rette,intersezione di una retta e di una circonferenza, intersezione di due circonferenze.

27

1. la retta per due punti con coordinate in un campo Ki ha equazione con coefficienti nello stesso Ki;

2. il punto intersezione di due rette con equazioni a coefficienti in un campo Ki ha coordinate in Ki;

3. un punto itersezione di una retta e di una circonferenza oppure di due circonferenze conequazioni a coefficienti in un medesimo campo Ki e un punto che ha coordinate in Ki oppure in uncampo estensione quadratica di Ki (qualora l’equazione risultante di secondo grado alla quale siperviene ponendo a sistema le equazioni date sia priva di radici in Ki).

Da 1-3 segue che, nella suddetta sequenza dei campi si ha in ogni caso Ki+1 = Ki(t), dove t euna radice di un polinomio f(X) ∈ Ki[X] irriducibile di grado d ≤ 2; il campo Ki+1 e un Ki−spaziovettoriale di dimensione [Ki+1 : Ki] = d ∈ {1, 2}, ove naturalmente, se d = 1 si ha t ∈ Ki e Ki+1 = Ki.Conseguentemente:

[Kn : K0] = [Kn : Kn−1] · · · [K2 : K1][K1 : K0] = 2h dove 0 ≤ h ≤ n.

In conclusione, se un punto P (a, b) e costruibile (con riga e compasso a partire da P), ciascuna delle suecoordinate e anzitutto un numero algebrico su K0 ed inoltre il suo di grado di algebricita su K0 e unapotenza di due26.

Viceversa mostriamo che un numero reale α algebrico su K0 di grado una potenza di due, 2i, e costruibilecon riga e compasso a partire da P, purche il campo K := K(α) contenga una catena di sottocampiK0 < K1 < · · · < Ki−1 < Ki = K tali che [Ks : Ks−1] = 2 per ogni s = 1, 2, . . . , i. Se i = 0, allora α eovviamente costruibile al pari di ogni elemento di K0; se i > 0, allora α e della forma α = a + b

√c, con

a, b, c ∈ Ki−1. Procedendo per induzione su i, possiamo supporre che a, b, c siano costruibili e da cio seguesubito che anche α lo e in quanto le operazioni da effettuare su a, b, c per ottenere α possono essere eseguitecon riga e compasso. �

Si noti che la condizione espressa dal Teorema di Wantzel (algebricita di grado una potenza di 2) enecessaria ma non sufficiente, in quanto, come insegna la Teoria di Galois, esistono estensioni algebrichedi K0 = Q di grado una potenza di due non ottenibili effettuando successive estensioni di grado 2.

Si noti che se P = {(0, 0), (1, 0), (0, 1)}, si ha K0 = Q, ed i numeri costruibili con riga e compasso sonoprecisamente i numeri euclidei.

I PROBLEMI ’IMPOSSIBILI’ DELL’ANTICHITA

I problemi ”impossibili” dell’antichita sono: La duplicazione del cubo, la quadratura del cerchio, la retti-ficazione della circonferenza e la trisezione dell’angolo. Dopo oltre duemila anni dalla loro formulazione, estato dimostrato che questi problemi sono di impossibile soluzione. Sebbene questa impossibilita sia statadimostrata rigorosamente, esistono ancora oggi matematici dilettanti e amatori della matematica che cercanodi ottenere le costruzioni richieste. Le loro argomentazioni contengono errori di deduzione, oppure risolvonoil problema in qualche caso particolare, mostrando cosı la non conoscenza esatta del problema. E estrema-mente interessante il fatto che una disciplina scientifica (la matematica) rifletta su se stessa e sancisca chealcuni problemi della stessa disciplina sono di risoluzione impossibile.

Il problema della duplicazione del cubo. Dato lo spigolo a di un cubo, costruire con riga e compassolo spigolo b del cubo di volume doppio. La condizione porta a b3 = 2a3 e dunque a b = a 3

√2. Assumendo

un riferimento cartesiano in cui il segmento a sia il segmento dell’asse delle ascisse con estremi i punti(0, 0) e (1, 0), si tratta di costruire con riga e compasso il punto ( 3

√2, 0), ossia costrure, come si dice, il

26Ad esempio il numero a + b√

3, con a e b razionali e euclideo (costruibile dai punti (0, 0), (1, 0), (0, 1)), in accordo col fattoche esso e algebrico di grado 2: infatti annulla il polinomio X2 − 2aX + a2 − 3b2 che e irriducibile su Q perche (X − (a +b√

3))(X − (a− b√

3) e la sua (unica) fattorizzazione.

28

numero 3√

2, a partire dall’insieme P = (0, 0), (1, 0), (0, 1). In questo caso K0 = Q. Il numero 3√

2 e pero unnumero algebrico di grado 3 (infatti e radice del polinomio X3 − 2, irriducibile su Q per il criterio diEisenstein27 e dunque, a norma del Teorema di Wantzel, non e un numero costruibile. Dunque il problemadella duplicazione del cubo e impossibile28.

Il problema della quadratura del cerchio. Costruire con riga e compasso un quadrato avente lastessa area di un cerchio di raggio r assegnato. La costruzione e impossibile29 Vediamo perche. Il cerchiodato ed il quadrato da costruire hanno area πr2. Il lato del quadrato da costruire vale dunque r

√π. Come

nel caso precedente possiamo assumere r come segmento unitario sull’asse delle ascisse. Si tratta dunquea partire dai punti (0, 0) e (1, 0) di costruire con riga e compasso il punto (

√π, 0), ossia costrure, come si

dice, il numero√

π. Questo e impossibile perche√

π e trascendente, in quanto, come ha dimostrato nel 1882Ferdinand LINDEMANN (1852-1939), il numero π e trascendente, mentre i numeri costruibili con riga ecompasso sono, a norma del Teorema di Wantzel, (particolari) numeri algebrici.30

Il problema della rettificazione della circonferenza. Costruire con riga e compasso un segmentoavente la stessa lunghezza di una circonferenza di raggio assegnato. La costruzione e impossibile. GiaArchimede aveva dimostrato l’equivalenza tra questo problema e quello della quadratura del cerchio. Nelcaso della circonferenza, si tratterebbe evidentemente di costruire il numero π con riga e compasso a partiredai punti (0, 0) e (1, 0) dell’asse delle ascisse, e questo e impossibile perche π e trascendente e dunque non ecostruibile a norma del Teorema di Wantzel.

Il problema della trisezione dell’angolo. Ripartire con riga e compasso un angolo dato in tre angoliuguali. Dimostriamo che:

Lemma 13 Un angolo di misura θ in radianti e trisecabile con riga e compasso sse il polinomio

4X3 − 3X − cos θ (1)

e riducibile in Q(cos θ)[X] 31.

Dimostrazione. Si cominci con l’osservare che un angolo di misura θ in radianti e dato sse e dato ilpunto (cos θ, 0). Pertanto un angolo di misura θ e trisecabile con riga e compasso sse il punto Q = (cos θ

3 , 0)e costruibile con riga e compasso a partire dai numeri del campo Q(cos θ). Questa costruibilita implica - peril Teorema di Wantzel - che il numero

cosθ

3sia algebrico su Q(cos θ) di grado una potenza di due. Ricordiamo ora la formula trigonometrica

cos 3α = 4 cos3 α− 3 cos α; (2)

27Il criterio di Eisenstein (Ferdinand Gotthold Eisenstein, 1823-1852) afferma che se F (X) = Xn + an−1Xn−1 + · · · + a0 eun polinomio a coefficienti in Z , se p e un numero primo che divide tutti gli ai (0 ≤ i ≤ n− 1) e se p2 non divide a0, alloraF (X) e irriducibile in Q[X]. Alternativamente: se X3 − 2 fosse riducibile su Q avrebbe uno zero m

ncon m, n interi primi fra

loro, e quindi si otterrebbe m3 = 2n3, il che e impossibile perche il primo membro contiene il fattore 2 con esponente congruoa 0 modulo 3, mentre il secondo membro contiene il fattore 2 con esponente congruo a 1 modulo 3. Alternativamente ancora:se X3 − 2 fosse riducibile in Q[X] allora (per il Lemma di Gauss) sarebbe riducibile in Z[X] e dunque (passando modulo 4)sarebbe riducibie in Z4[X] il polinomio X3 − 2 = X3 + 2, che invece e ivi irriducibile perche X3 + 2 non ha zeri in Z4.

28Si noti che invece e risolubile Il problema della duplicazione del quadrato: dato il lato a di un quadrato, costruire con riga ecompasso il lato x del quadrato di area doppia. La condizione porta a x2 = 2a2 e dunque a x = a

√2. Dunque x e la diagonale

del quadrato Q di lato a. Il quadrato Q e costruibile con riga e compasso a partire dal segmento a. Dunque anche la diagonaledi Q lo e.

29Mentre, come abbiamo visto, e possibile quadrare con riga e compasso un qualsiasi poligono convesso.30Si ricordi che un numero e trascendente se non e algebrico (vale a dire non annulla alcun polinomio a coefficienti razionali

non tutti nulli). Si ricordi che i numeri algebrici formano un campo: il campo algebrico; in particolare il quadrato di unnumero algebrico e algebrico (equivalentemente: la radice quadrata di un numero trascendente e trascendente).

31Q(cos θ) e il campo estensione di Q con l’aggiunta del numero cos θ, ossia l’intersezione di tutti i campi contenenti Q e cos θ.

29

ponendovi α = θ3 , si ottiene:

cos θ = 4 cos3θ

3− 3 cos

θ

3.

Questa uguaglianza prova che cos θ3 e sicuramente algebrico su Q(cos θ) di grado d ≤ 3 perche annulla il

polinomio (1); il numero cos θ3 e poi costruibile sse il suo grado di algebricita e d = 1 oppure d = 2, e questo

accade sse il polinomio (1) e riducibile in Q(cos θ)[X], ossia e fattorizzabile nel prodotto di polinomi di gradopiu basso (d = 1 = 20 e d = 2 = 21) a coefficienti in Q(cos θ). Cio dimostra l’asserto. �

Ad esempio l’angolo θ = π2 e trisecabile, perche cos θ = cos π

2 = 0, Q(cos θ) = Q ed il polinomio (1)diventa 4X3− 3X che e riducibile su Q. Da cio segue senz’altro che anche l’angolo θ = π e trisecabile; alter-nativamente, possiamo dimostrarlo ripetendo l’argomento generale: si ha cos θ = cos π = −1, Q(cos θ) = Qed il polinomio (1) diventa 4X3 − 3X + 1 che e riducibile su Q (ha la radice 1

2 ). Anche l’angolo θ = 2π etrisecabile; come segue senz’altro dalla trisecabilita di π

2 ; alternativamente, possiamo dimostrarlo ripetendol’argomento generale: si ha cos θ = cos 2π = 1, Q(cos θ) = Q ed il polinomio (1) diventa 4X3 − 3X − 1 che eriducibile su Q (ha la radice 1). Dimostriamo finalmente che, invece:

Teorema 14 L’angolo θ = π3 non e trisecabile con riga e compasso.

Dimostrazione. Si ha cos θ = cos π3 = 1

2 , Q(cos θ) = Q, ed il polinomio (1) diviene 4X3− 3X − 12 , la cui

riducibilita su Q equivale - come si vede effettuando il cambiamento di variabile Y = 2X, cioe X = Y2 - alla

riducibilita su Q diY 3 − 3Y − 1. (3)

La riducibilita del polinomio (3) in Q[Y ] equivale alla sua riducibilita in Z[Y ] per il Lemma di Gauss;d’altra parte, se (3) fosse riducibile in Z[Y ], una sua fattorizzazione in Z[Y ] si potrebbe leggere come unafattorizzazioone in Z2[Y ] del polinomio Y 2 − 3Y − 1 = Y 3 + Y + 1, polinomio che manifestamente none fattorizzabile in Z2[Y ] perche e di terzo grado e non ha zeri in Z2. In definitiva il polinomio (1) non eriducibile in Q[X], e l’angolo π

3 non e trisecabile. �

Abbiamo visto che. ad esempio, l’angolo di π2 radianti e trisecabile, mentre quello di π

3 radianti non lo e.Dunque il problema e generalmente impossibile (Wantzel, 1837), mentre lo e in alcuni casi particolari.

ESERCIZIO. Si dimostri che l’angolo π3 si puo trisecare usando la riga graduata e il compasso.

Il Teorema (14) afferma che non si puo costruire con riga e compasso l’angolo 13

π3 = π

9 = 2π18 . Ne segue

che: non si puo (con riga e compasso) inscrivere in una circonferenza un poligono regolare di n = 18 odi n = 9 lati. Si noti che, per il problema della costruibilita con riga e compasso di un n−gonoregolare, e equivalente prefissare il raggio del cerchio circoscritto o il lato del poligono. Infatti ilprimo problema equivale alla costruzione dell’angolo 2π

n (angolo al centro che insiste su un lato dell’n−gono),mentre il secondo equivale alla costruzione dell’angolo π− 2π

n (angolo interno dell’n−gono). Inoltre il poligonoregolare di n lati e costruibile sse lo e quello di 2n lati.

Costruzione di poligoni regolari. Costruire con riga e compasso il poligono regolare con un assegnatonumero n di lati. Karl Friedrich GAUSS (1777-1855) ha determinato per quali valori di n e possibile costruirecon riga e compasso il poligono regolare con n lati. Il risultato puo essere riassunto nel seguente enunciato,la cui dimostrazione viene qui omessa32.

32Per la dimostrazione, cfr. ad esempio C. PROCESI, Elementi di teoria di Galois, I, 4, ed. Decibel 1982, od anche N.JACOBSON, Basic Algebra, vol. I, Freeman and Co, 1974.

30

Teorema 15 Le condizioni segueni sono equivalenti:1. Il poligono regolare di n lati e costruibile con riga e compasso.2. φ(n) e una potenza di 2, dove φ e la funzione di Eulero.3. n = 2kp1 . . . ps, dove k, s ≥ 0 e p1, . . . , ps sono s primi di Fermat distinti.

Si dimostri per esercizio che 3 ⇒ 2. Ricordiamo alcune nozioni basilari riguardanti gli enti sopra nominati.

Funzione φ di Eulero. La funzione φ : N → N : n 7→ φ(n) di Eulero e definita da:

φ(n) :=| {k ∈ N : 1 ≤ k ≤ n, (k, n) = 1} | .

Dunque φ(n) uguaglia la cardinalita | U(Zn) | del gruppo U(Zn) degli elementi invertibili dell’anelloZn.

La φ e una funzione moltiplicativa, nel senso che:

(m,n ∈ N) (m,n) = 1 ⇒ φ(mn) = φ(m)φ(n),

Per dimostrarlo, osserviamo anzitutto che l’applicazione

f : Zmn → Zm × Zn : [a]mn 7→ ([a]m, [a]n)

e evidentemente un morfismo di anelli, che e iniettivo perche ha nucleo [0]mn per l’ipotesi (m,n) = 1 ed eanche surgettivo33 perche Zmn e Zm × Zn hanno lo stesso numero mn di elementi. Pertanto f : Zmn →Zm × Zn e un isomorfismo di anelli, che evidentemente subordina un isomorfismo tra i rispettivi gruppidegli elementi invertibili

f : U(Zmn) → U(Zm × Zn) = U(Zm)× U(Zn).

Pertanto φ(mn) =| U(Zmn) |=| U(Zm) || U(Zn) |= φ(m)φ(n), e questo completa la verifica della moltiplica-tivita di φ.

Numeri di Fermat. L’ n−mo numero di Fermat (Pierre Simone de FERMAT, 1601-1665) e definito da

(n ≥ 0) Fn := 2(2n) + 1.

Si dimostra che tutti i numeri primi della forma

2k + 1

sono numeri di Fermat. Lo stesso Fermat noto che

F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537

sono primi e congetturo nel 1640 che ogni Fn fosse primo, ma Eulero dimostro nel 1732 che la congettura erafalsa, indicando una fattorizzazione di F5 = 232 + 1. Ancora oggi i numeri primi di Fermat che si conosconosono soltanto i cinque numeri sopra indicati! E sorprendente che esista la dimostrazione della possibilita dicostruire con riga e compasso il poligono regolare con un numero tanto grande di lati, quale e il numeroprimo F4.

33La surgettivita di f va sotto il nome di Teorema Cinese dei Resti. il quale afferma: Se m, n sono relativamente primied a1, a2 sono interi arbitrari, il sistema di due congruenze

x ≡ a1 (mod m), x ≡ a2 (mod n),

e ’univocamente’ risolubile. Infatti l’elemento ([a1]m, [a2]n) proviene tramite f da un’unica classe resto [a]mn, e dunque a euna soluzione del sistema (univocamente determinata modulo mn). Si noti che si ottiene una ovvia generalizzazione dal casodi due moduli m, n al caso di s ≥ 2 moduli m1, m2, . . . , ms primi fra loro: si considera il morfismo di anelli

f : Zm1···ms → Zm1 × · · · × Zms : [a]m1···ms 7→ ([a]m1 , . . . , [a]ms ),

si dimostra che f e iniettivo e quindi surgettivo perche i due anelli hanno la stesso numero m1 · · ·ms di elementi; si considerapoi un sistema di congruenze x ≡ a1 (mod m1), . . . , x ≡ as (mod ms), che si risolve assumendo x = a, dove [a]m1... ms

e il prototipo in f di ([a1]m1 , . . . , [as]ms ).

31

4 Un tributo ad Hilbert: il ”Terzo Problema di Hilbert”

4.1 Introduzione

La nozione di poligono convesso di R2 e quella di poliedro convesso di R3 sono casi particolari, rispet-tivamente per d = 2 e per d = 3, di quella di politopo convesso di dimensione d di Rd.

Un politopo convesso d−dimensionale P di Rd e per definizione la chiusura convessa

P = conv(S) := {∑

aisi : ai ≥ 0,∑

ai = 1}

di un insieme finito S = {s1, . . . , sn} ⊂Rd di punti contenuto in Rd ma non contenuto in un Rt con t < d.Esempi di politopi convessi di dimensione d sono i d−simplessi (per S costituito da d+1 punti indipendenti)e i d−cubi, come ad esempio il d−cubo unitario Qd = [0, 1]d. Un politopo generale e definito come unionedi un numero finito di politopi convessi.

Equivalentemente un politopo convesso di Rd puo essere definito come un insieme limitato P ⊂ Rd chesia il luogo delle soluzioni di un sistema di disuguaglianze lineari, cioe come un insieme limitato del tipo

P = {x ∈ Rd : Ax ≤ b},

dove A e una matrice reale k × d e b ∈ Rk. Questa seconda definizione puo riformularsi dicendo che unpolitopo convesso e un insieme limitato P ⊂ Rd che sia intersezione di semispazi di Rd.

Una faccia di un politopo e un insieme F ⊂ P del tipo F = {x ∈ P : aix = bi}, dove ai e la riga i-esimadella matrice A e bi e la componente i-esima della colonna b, per i ∈ {1, 2, . . . , k}. Tale faccia appare dunquecome intersezione del politopo con uno degli iperpiani che definiscono uno dei semispazi di cui il politopo el’intersezione.

La teoria della misura per i poliedri appare piu complicata di quella per i poligoni. La formula peril calcolo dell’area di un triangolo si fonda sul fatto che ”ogni triangolo e equivalente (equiesteso) ad unparallelogramma con ugual base e meta altezza”; il che a sua volta si fonda sul fatto che quel triangolo equel parallelogramma sono equiscomponibili, cioe possono essere decomposti in poligoni congruenti. Ineffetti sussiste il seguente

Teorema 16 (Bolyai, Gerwin, 1832 circa). Due poligoni sono equiestesi se e solo se sono equiscomponibili.�

Nello sviluppo della teoria elementare del calcolo dei volumi dei poliedri, si inizia con il calcolo del vol-ume di un cubo, poi di un parallelepipedo retto rettangolo, poi di un parallelepipedo generale e poi di unprisma a base poligonale. Tuttavia, dovendo calcolare il volume di un tetraedro, sorgono delle difficolta:occorrerebbe dimostrare che un tetraedro e equivalente alla terza parte di un prisma avente la stessa base ela stessa altezza, e per questo occorre dimostrare che due tetraedri aventi la stessa base e la stessa altezzasono equivalenti. Questo scopo sarebbe dunque raggiunto se si potesse dimostrare che due tetraedri aventila stessa base e la stessa altezza sono scomponibili in poliedri congruenti, il che pero, come vedremo, e gen-eralmente falso.

Questa difficolta fa sı che la formula per il calcolo del volume di un tetraedro si basi su procedimentiinfinitesimali : ad es. sulla considerazione del tetraedro come elemento di separazione di due classicontigue di scaloidi, inscritti e circoscritti al tetraedro.

David Hilbert ebbe l’intuizione che questa maggiore complicazione fosse ineliminabile, intuendo che es-istono poliedri di ugual volume che non sono equiscomponibili (cioe decomponibili in poliedricongruenti). Piu precisamente egli formulo il seguente

32

TERZO PROBLEMA DI HILBERT: Trovare due tetraedri di uguali basi e uguali altezze che nonsono equiscomponibili (cioe decomponibili in tetraedri congruenti) e che non sono equicompletabili (cioecombinabili con tetraedri congruenti in modo da formare poliedri equiscomponibili).

Tale problema era stato posto da Hilbert nella sua gia ricordata memorabile conferenza, tenuta duranteil Secondo Congresso Internazionale dei Matematici svoltosi a Parigi nel 1900, nella quale attiro l’attenzionedella comunita matematica su 23 importanti problemi, come argomenti fondamentali da affrontare nel corsodel secolo che stava iniziando . Il Terzo Problema di Hilbert34 fu risolto completamente dal suo allievo MaxDEHN: egli esibı (nello stesso 1900) due tetraedri con ugual base e eguale altezza non equiscomponibili e poianche (nel 1902) non equicompletabili. La dimostrazione alquanto oscura di Dehn fu ripresa da vari autori35

e finalmente perfezionata da Hugo HADWIGER in due successivi articoli (1949, 1954).

4.2 Invarianti di Dehn

Dato un poliedro P di R3, denotiamo con e ∈ P un suo spigolo, con α(e) l’angolo diedro fra le due facceche contengono e, e con M(P ) (insieme delle ampiezze di P ) l’insieme costituito da π e dalle ampiezze degliangoli diedri di P , cioe:

M(P ) := {π} ∪ {α(e) : e ∈ P}.Per esempio, l’insieme delle ampiezze di un cubo C e quello di un prisma retto R avente per base untriangolo equilatero sono dati rispettivamente da:

M(C) = {π,π

2}, MR = {π,

π

2,π

3}.

Fissato un qualunque insieme finito M ⊂ R contenente M(P ) , sia

V (M) := {∑

qm ·m : m ∈ M, qm ∈ Q} ⊂ R

il Q−spazio vettoriale delle combinazioni lineari degli elementi di M con coefficienti razionali. Fissata unaqualunque applicazione Q−lineare

f : V (M) → Q tale che f(π) = 0,

si definisce peso (in P ) di uno spigolo e di P relativo ad f il prodotto tra la lunghezza l(e) di e ed ilvalore che f assume sull’ angolo diedro α(e) di quel poliedro, cioe il numero reale

wf (e) = wf (e, P ) := l(e)f(a(e)).

Definiamo poi invariante di Dehn del poliedro P relativo ad f il numero

Df (P ) :=∑e∈P

l(e)f(α(e)),

cioe la somma dei pesi in P degli spigoli di P . Ad esempio, sia per il cubo C sia per il suddetto prisma R,l’invariante di Dehn rispetto ad una qualsiasi f vale zero (perche f si annulla su ogni multiplo razionale diπ):

Df (C) = 0, Df (R) = 0.

Per il seguito, conviene definire il peso non solo di uno spigolo e di un poliedro P , ma anche il peso (in P ) diun tratto quasiasi e′ ⊆ e come il prodotto tra la lunghezza l(e′) di e′ ed il valore che f assume sull’ampiezzaα(e′) = α(e) del corrispondente angolo diedro di P :

wf (e′, P ) = wf (e′) := l(e′)f(α(e′)).

E importante notare che:34Cfr. V.G. BOLTIANSKII, Hilbert’s Third Problem. Washington, 1978; cfr. anche V. VILLANI, ”aree, volumi ed il Terzo

Problema di Hilbert”, in Archimede 53 (2001), 78-91.35Tra cui Ugo AMALDI in un articolo del 1902 pubblicato sul Periodico di Matematica.

33

Lemma 17 . Se uno spigolo e di P e decomposto in segmenti e1, . . . , es a due a due privi di punti internicomuni, il peso di e e la somma dei pesi degli ei.

Dimostrazione. Infatti, essendo α(e) = α(ei) per ogni i = 1, . . . , s, si ha:

wf (e) := l(e)f(α(e)) = [∑

i

l(ei)]f(α(e)) =∑

i

[l(ei)f(α(e))] =∑

i

[l(ei)f(α(ei))] =∑

wf (ei). �

4.3 Il Teorema di Dehn-Hadwiger

Ricordiamo che due poliedri P e Q si dicono equiscomponibili se possono essere decomposti in un numerofinito di poliedri

P = P1 ∪ · · · ∪ Pn, Q = Q1 ∪ · · · ∪Qn

tali che i poliedri Pi siano a due a due privi di punti interni in comune, i poliedri Qi siano a due a due prividi punti interni in comune ed inoltre i poliedri Pi e Qi siano congruenti per ogni i (1 ≤ i ≤ n).

Precisiamo poi che due poliedri P e Q si dicono equicompletabili se esistono insiemi finiti di poliedriP1, . . . , Pm e Q1, . . . , Qn tali che

– ogni Pi non abbia punti interni in comune ne con P ne con alcun Pj (per ogni i 6= j);– ogni Qi non abbia punti interni in comune ne con Q ne con alcun Qj (per ogni i 6= j);– Pi e Qi siano congruenti per ogni i (1 ≤ i ≤ m);– P ′ = P ∪ P1 ∪ · · · ∪ Pm e Q′ = Q ∪Q1 ∪ · · · ∪Qm sono equiscomponibili.

Evidentemente poliedri equiscomponibili sono anche equicompletabili e pertanto poliedri non equicom-pletabili sono non equiscomponibili.

Lemma 18 Sia P un poliedro scomponibile in un numero finito di poliedri P1, . . . , Pn e sia M un qualsiasiinsieme finito di numeri reali contenente π e tutte le ampiezze degli angoli diedri di P e di P1, . . . , Pn.

Per ogni applicazione Q − linearef : V (M) → Q tale che f(π) = 0, l’invariante di Dehn di P e lasomma degli invarianti di Dehn dei Pi:

Df (P ) = Df (P1) + · · ·+ Df (Pn).

Dimostrazione. Il primo membro e la somma dei pesi wf (e, P ) estesa a tutti gli spigoli e di P . Il secondomembro e la somma dei pesi wf (e∗, Pi) estesa a tutte le coppie (e∗, Pi) costituite da un sottopoliedro Pi e daun suo spigolo e∗, i = 1, . . . , n. Il contributo di ciascun spigolo e∗ e la somma dei pesi wf (e∗, Pi) = l(e∗)f(αi)estesa a tutti quei sottopoliedri Pi che hanno e∗ come uno dei propri spigoli (αi denota l’angolo diedroformato dalle due facce di Pi che contengono e∗), e dunque, vale l(e∗)f(α), dove α denota la somma degliαi, perche f e additiva.Calcoliamo dunque il secondo membro riordinando in modo opportuno i vari addendi che vi intervengono.Uno spigolo e∗ di un sottopoliedro puo essere di tre tipi distinti:

e′ ) coincidente con uno spigolo e di P o con una sua parte;e′′) contenuto nell’interiore di una faccia di P ;e′′′) contenuto nell’interiore di P .

Il contributo di un qualunque spigolo di tipo e′′ vale zero. Infatti, la somma delle ampiezze degli angolidiedri dei vari sottopoliedri aventi a comune un fissato spigolo di tipo e” vale evidentemente π. Poiche

34

f(π) = 0, il contributo complessivo di e′′ nella somma a secondo membro vale l(e′′)f(π) = 0.Analogamente, il contributo di un qualunque spigolo di tipo e′′′ vale zero. Infatti, la somma delle ampiezze

degli angoli diedri (dei sottopoliedri) aventi a comune un fissato spigolo di tipo e′′′ vale evidentemente 2π.Poiche f(2π) = 0, il contributo complessivo di e′′′ nella somma a secondo membro vale l(e′′′)f(2π) = 0.

Limitiamoci pertanto a considerare i contributi degli spigoli di tipo e′. Consideriamo dunque uno spigolodi tipo e′ contenuto in un fissato spigolo e di P . La somma delle ampiezze degli angoli diedri (dei sottopoliedri)aventi il dato e′ come proprio spigolo coincide evidentemente con l’ampiezza dell’angolo diedro α(e) di P .Pertanto il contributo di e′ a secondo membro vale l(e′)f(α(e)) ossia uguaglia il peso (in P ) wf (e′, P ) delpezzo e′ ⊂ e.

Raggruppiamo tutti gli spigoli e′1, . . . , e′s di tipo e′ che sono pezzi di un medesimo spigolo e di P

(del quale costituiscono evidentemente una partizione). Per il Lemma 17, la somma dei pesi di questie′i ⊂ e uguaglia il peso di e in P.

D’altra parte, ogni spigolo e di P determina l’insieme E′(e) degli spigoli e′ dei sottopoliedri tali chee′ ⊂ e ; gli insiemi E′(e) costituiscono al variare di e una partizione dell’insieme degli spigoli di tipo e′ deivari sottopoliedri. In conclusione il contributo complessivo degli spigoli di tipo e′, cioe il valore del secondomembro, uguaglia la somma dei pesi degli spigoli e di P , cioe uguaglia il valore del primo membro. �

Teorema 19 (Dehn–Hadwiger). Siano P e Q due poliedri, sia M un qualunque insieme finito di numerireali contenente π e tutte le ampiezze degli angoli diedri di P e di Q, e sia f : V (M) → Q una qualunqueapplicazione Q−lineare tale che f(π) = 0. Allora:

(1) Se P e Q sono equiscomponibili, i loro invarianti di Dehn uguali: Df (P ) = Df (Q).(2) Se P e Q sono equicompletabili, i loro invarianti di Dehn uguali: Df (P ) = Df (Q).

Dimostrazione. (1) Sia M ′ l’insieme ottenuto aggregando ad M tutte le ampiezze degli angoli diedridei pezzi P1, . . . , Pn e Q1, . . . , Qn coinvolti in una realizzazione della equiscomponibilita di P e di Q, e siag : V (M ′) → Q una qualunque applicazione Q−lineare che prolunghi f (ottenuta in modo ovvio estendendouna base di V (M) contenente π ad una base di V (M ′) ). Per il Lemma 17, si ha

Df (P ) = Dg(P ) = Dg(P1) + · · ·+ Dg(Pn); Df (Q) = Dg(Q) = Dg(Q1) + · · ·+ Dg(Qn);

d’altra parte, per ogni i = 1, . . . , n, si ha Dg(Pi) = Dg(Qi) perche Pi e Qi sono congruenti. PertantoDf (P ) = Df (Q).

(2) Sia M ′ l’insieme ottenuto aggregando ad M tutte le ampiezze degli angoli diedri dei pezzi P1, . . . , Pm

e Q1, . . . , Qm coinvolti in una realizzazione della equicompletabilita di P e di Q, e sia g : V (M ′) → Q unaqualunque applicazione Q−lineare che prolunghi f . Attualmente

P ′ := P ∪ P1 ∪ · · · ∪ Pm, Q′ := Q ∪Q1 ∪ · · · ∪Qm

sono equiscomponibili, pertanto da (1) segue Dg(P ′) = Dg(Q′) e dal Lemma 17 si ottiene (essendo Dg(P ) =Df (P ) e Dg(Q) = Df (Q)):

Dg(P ′) = Df (P ) + Dg(P1) + ... + Dg(Pm) = Df (Q) + Dg(Q1) + ... + Dg(Qm) = Dg(Q′);

d’altra parte, per ogni i = 1, . . . ,m, si ha Dg(Pi) = Dg(Qi) perche Pi e Qi sono congruenti. PertantoDf (P ) = Df (Q). �

4.4 La soluzione del Terzo Problema di Hilbert

Calcoliamo gli invarianti di Dehn per alcuni poliedrii. Vedremo che i poliedri di cui al n. 4.4.4 e al n. 4.4.5sono due tetraedri con la stessa base e la stessa altezza, ma con invarianti di Dehn diversi (e dunque nonequiscomponibili).

35

4.4.1 Invariante di Dehn di un cubo. Come gia osservato, l’insieme delle ampiezze di un cubo C edato da M(C) = {π, π

2 }, e pertanto l’invariante di Dehn di C rispetto ad una qualsiasi f vale zero, perchef si annulla su ogni multiplo razionale di π, cioe Df (C) = 0.

4.4.2 Invariante di Dehn di un prisma retto con base un triangolo equilatero. Come giaosservato, l’insieme delle ampiezze di tale prisma P e dato da M(P ) = {π, π

2 , π3 }, e pertanto l’invariante di

Dehn di P rispetto ad una qualsiasi f vale zero, cioe Df (P ) = 0.

4.4.3. Invariante di Dehn di un tetraedro regolare. Sia T0 = (A,B,C, D) un tetraedro regolare dispigolo s. L’insieme delle ampiezze di T0 e dato da M(T0) = {π, α} dove α e l’angolo tra le mediane AM e DMdelle facce ABC e BCD rispettivamente. La proiezione ortogonale H di D sulla faccia ABC e il baricentrodel triangolo. Pertanto, con riferimento al triangolo rettangolo DHM , si ha cos α = HM

DM = HMAM = 1

3 , ossiaα = arccos 1

3 . Poicheα

π=

arccos 13

π

e irrazionale (per il successivo Lemma 20, ove si ponga n = 9), lo spazio vettoriale V (M(T0)) ha dimensione2 ed

M(T0) = {π, α}e una sua base.

Possiamo considerare l’applicazione Q−lineare

f : V (M(T0)) → Q

definita sulla base M(T0) assumendo f(π) = 0 ed f(α) = 1. Pertanto si trova Df (T0) = 6s 6= 0.

Lemma 20 36 Per ogni intero dispari n ≥ 3, il numero

A(n) :=arccos 1√

n

π

e irrazionale. �

Riguardo all’ipotesi che n sia dispari, si noti che A(1) = 0, A(2) = 14 , A(4) = 1

4 . In realta si potrebbeaddirittura dimostrare che A(n) e razionale solo per n = 1, 2, 4.

Il significato geometrico del Lemma 20 – che afferma la incommensurabilita tra π e arccos 1√n

per ogniintero dispari n ≥ 3 – e il seguente. Si consideri la poligonale che inizia nel punto A origine degli archi delcerchio trigonometrico di centro O e che consiste di lati tutti uguali alla corda AB che sottende un angoloAOB il cui coseno e 1√

n. Allora, la suddetta incommensurabilita esprime che questa poligonale prosegue

all’infinito senza chiudersi mai su se stessa.

4.4.4 Invariante di Dehn del tetraedro avente i vertici nell’origine e nei punti unitari degliassi. L’insieme delle ampiezze di questo tetraedro T1 = (O,A,B,C) e dato da

M(T1) = {π,π

2, α}

dove α e l’angolo tra le mediane CM e OM delle facce ABC e OAB rispettivamente. Con riferimento altriangolo rettangolo COM , si ha cos α = OM

CM . D’altra parte, nel triangolo rettangolo AOC, si ha AC =√

2,

onde nel triangolo rettangolo CMA si ha CM =√

32 , e nel triangolo rettangolo COM si ha OM =

√12 ,

onde cos α = 1√3, ossia α = arccos 1√

3. Poiche

α

π=

arccos 1√3

π36Cfr. M. AIGNER, G.M. ZIEGLER, Proofs from the B00K. Springer, 1998, p.31-32.

36

e irrazionale, come segue ponendo n = 3 nel Lemma 20, lo spazio vettoriale V (M(T1)) ha dimensione 2(ed M(T1) e una sua base). Possiamo considerare l’applicazione Q−lineare f : V (M(T1)) → Q definita sullabase

M(T1) = {π,π

2, α}

assumendo f(π) = 0 ed f(α) = 1. Pertanto f(π2 ) = 0 e dunque Df (T1) = 3f(π

2 ) + 3√

2f(α) = 3√

2 6= 0,ossia Df (T1) = 3

√2 6= 0.

4.4.5 Invariante di Dehn del tetraedro avente i vertici nell’origine, nei punti unitari degliassi x ed y e nel punto unita del piano yz. Sia T2 = (O, A,B,C ′), dove:

O(0, 0, 0);A(1, 0, 0);B(0, 1, 0);C ′(0, 1, 1).

Le facce di T2 hanno equazioni:

OAB : Z = 0; OBC ′ : X = 0; ABC ′ : X + Y − 1 = 0; OAC ′ : Y − Z = 0;

ed i loro versori normali sono rispettivamente:

(0, 0, 1); (1, 0, 0); (1√2,

1√2, 0); (0,

1√2,− 1√

2).

Pertanto i coseni dell’angolo diedro α(e) fra le due facce contenenti uno spigolo e di T2 sono:

e = OB, OC ′, AB ⇒ cos α(e) = 0 ⇒ α(e) = π2 ;

e = AC ′ ⇒ cos α(e) = 1/2 ⇒ α(e) = π3 ;

e = 0A,BC ′ ⇒ | cos α(e) |= 1√2⇒ α(e) = π

4 .

Ne segue che l’insieme delle ampiezze di T2 e dato da M(T2) = {π, π2 , π

3 , π4 , }, lo spazio vettoriale V (M(T2))

e < π >= Q · π, ha dimensione 1, e l’unica funzione Q− lineare f : V (M(T2)) → Q tale che f(π) = 0 e lafunzione nulla. Pertanto Df (T2) = 0.

CONCLUSIONI.(a) I tetraedri T1 e T2 hanno la stessa base e la stessa altezza, ma non sono ne equicompletabili ne

equiscomponibili. Cio segue dal Teorema di Dehn-Hadwiger e dal fatto che gli invarianti di Dehn di T1 e diT2 – relativi ad una stessa f – sono diversi: Df (T1) = 3

√2 6= 0, Df (T2) = 0. Si noti che lo spazio vettoriale

V (M(T2)) =< π >= πQ e un sottospazio di V (M(T1)) =< π, arccos 13 > e che la f definita su V (M(T1)) e

effettivamente un prolungamento della f definita su V (M(T2)).(b) Il tetraedro T1 ed un cubo C di egual volume non sono ne equicompletabili ne equiscomponibili.

Infatti Df (T1) = 3√

2 6= 0, Df (C) = 0, dove ecc.

5 Alcuni approfondimenti.

5.1 Ancora su numeri e polinomi

Sia N = {0, 1, 2, 3, . . . } l’insieme dei numeri interi non negativi. Quando si utilizza la numerazione inbase 10, l’insieme delle cifre usate e C10 = {c ∈ N : 0 ≤ c ≤ 9} ed ogni numero di N viene espresso come

37

una combinazione lineare di potenze di 10 a coefficienti in C10 cioe come una espressione polinomiale in 10con coefficienti in C10; ad esempio 372104 = 3 · 105 + 7 · 104 + 2 · 103 + 1 · 102 + 0 · 101 + 4 · 100. Piu ingenerale quando si utilizza la numerazione in base b, dove b ∈ N e b ≥ 2, l’insieme delle cifre usate eCb = {c ∈ N : 0 ≤ c ≤ b − 1} ed ogni numero n ∈ N viene espresso come una espressione polinomiale in bcon coefficienti in Cb, ossia come una espressione del tipo

n =d∑

i=0

ai · bi = ad · bd + · · ·+ a1 · b + a0, dove ai ∈ N, 0 ≤ ai < b e ad 6= 0.

Notiamo che a0 e il resto della divisione di n per b, e sia q1 =∑d

i=1 ai ·bi−1 il quoziente di questa divisione:n = b · q1 + a0; a1 e il resto della divisione di q1 per b, e sia q2 =

∑di=2 ai · bi−2 il quoziente di questa

divisione: q1 = b · q2 + a1; . . . ; ad−1 e il resto della divisione di qd−1 = b · qd + ad−1 per b, ed il quozientedi questa divisione vale qd = ad < b. Finalmente ad e il resto della divisione di qd = ad per b (il quoziente ezero): qd = b · 0 + ad dove qd = ad < b.

Il procedimento descritto consente di scrivere qualunque numero n ∈ N in una qualunque base fissatab ≥ 2. Osserviamo che

Proposizione 21 (Il giuoco del polinomio). Qualunque polinomio f(x) =∑d

i=0 ai · xi ∈ N[x], sia essoil polinomio nullo o un polinomio di un grado qualunque d ≥ 0, e individuato univocamente dalla conoscenzadi due soli valori: a = f(1) e c = f(a + 1).

Dimostrazione. Dimostriamo l’asserto, provando che f(x) = 0 (cioe f(x) e il polinomio nullo) nel caso chesia a = 0, e che i coefficienti di f(x) sono le cifre che appaiono nella scrittura di c in base b := a + 1 nel casoche sia a ≥ 1. Sia f(x) =

∑di=0 ai · xi ∈ N[x]. In ogni caso a := f(1) =

∑di=0 ai ≥ aj per ogni j. Se a = 0,

allora aj = 0 per ogni j e dunque f(x) e il polinomio nullo. Se a ≥ 1, allora, posto b := a + 1, si ha b ≥ 2 eb > aj per ogni j. Ne segue che f(b) =

∑di=0 ai · bi e la scrittura di c = f(a + 1) = f(b) in base b: in altri

termini i coefficienti aj di f(x) sono le cifre che appaiono della scrittura di c in base b.

La Proposizione 21 e particolarmente espressiva se si confronta col seguente teorema.

Teorema 22 . Dati comunque x1, . . . , xd+1 ∈ R distinti e dati comunque y1, . . . , yd+1∈ R (anche nondistinti), esiste uno ed un solo polinomio f(x) ∈ R[x] di grado ≤ d tale che f(xi) = yi per i = 1, . . . , d + 1.

Dimostrazione. Primo modo. La stringa (ad, . . . , a0) dei coefficienti di f(x) =∑d

i=0 ai ·xi e univocamentedeterminata perche e l’unica soluzione del sistema yj =

∑di=0 ai · xi

j , (j = 1, . . . , d + 1, di d + 1 equazionilineari nelle d+1 incognite ad, . . . , a0, il cui determinante e il determinante di Vandermonde V (x1, . . . .xd+1) =∏

1≤i<j≤d+1(xj − xi) 6= 0.Secondo modo. L’unicita del polinomio segue dal fatto che se f(x) e g(x) fossero due polinomi distinti deltipo detto, allora f(x) − g(x) sarebbe un polinomio non nullo di grado ≤ d con d + 1 zeri distinti, il che eimpossibile. L’esistenza e data dal polinomio interpolatore di Lagrange

f(x)=∑d+1

j=1 yj

Qi6=ji=1,...,d+1(x−xi)Qi6=j

i=1,...,d+1(xj−xi)= y1 · (x−x2)···(x−xd+1)

(x1−x2)···(x1−xd+1)+ · · ·+ yd+1 · (x−x1)···(x−xd)

(xd+1−x1)···(xd+1−xd) ·

38

5.2 Miscellanea algebrica

5.2.1 Non esistono campi propriamente intermedi tra R e C.

Mostriamo che, se K e un campo tale che R < K ≤ C, si ha K = C. Infatti, considerato un α ∈ K \ R,risulta α = a + ib, con a, b ∈ R e b 6= 0. Pertanto i ∈ K e quindi K = C.

5.2.2 Esistono infiniti campi propriamente intermedi tra Q e R.

Esempi di tali campi intermedi sono dati da: Q(√

2) = Q[√

2] = {a + b√

2 | a, b ∈ Q}, da Q(π) e piu ingenerale da Q(A), da Q(B) e da Q(A ∪ B), dove A,B − con Q ⊂ A ∪ B ⊂ R − sono rispettivamentecostituiti da numeri reali algebrici e trascendenti.

5.2.3 In un qualunque campo ordinato K ogni quadrato non nullo e positivo.

Sia infatti a = b2, con b ∈ K, b 6= 0. Allora b oppure −b e positivo e pertanto a = b · b = (−b)(−b) e positivoin quanto prodotto di due positivi.

5.2.4 Ogni elemento positivo di R e un quadrato di un elemento di R.

Infatti se a ∈ R e se a > 0 allora√

a ∈ R. Invece esistono elementi positivi di Q che non sono quadratidi elementi di Q: ad esempio 2 ∈ Q e positivo, ma

√2 /∈ Q. (Se fosse

√2 = m/n con m.n ∈ Z, si avrebbe

2n2 = m2, assurdo perche il fattore 2 comparirebbe un numero dispari di volte nel primo membro ed unnumero pari di volte nel secondo.)

5.2.5 Un automorfismo algebrico f di R e anche un automorfismo ordinale.

Infatti f : R → R trasforma quadrati non nulli in quadrati non nulli e dunque trasforma positivi in positivi(per 5.2.3) e pertanto e un isomorfismo ordinale: a < b ⇒ b − a > 0 ⇒ f(b − a) > 0 ⇒ f(b) − f(a) > 0 ⇒f(a) < f(b).

5.2.6 Azione di un automorfismo f di un campo K sul suo campo fondamentale F .

Evidentemente f|F = idF , perche, posto u := 1K , si ha, per ogni n, m ∈ Z, f(±nu) = ±nu, f(nu)−1 =(nu)−1, f((nu)(mu)−1) = (nu)(mu)−1.

39

5.2.7 Se f ∈ Aut(Q(√

2)), allora f(a + b√

2) = a± b√

2.

5.2.8 L’unico automorfismo del campo reale e l’identita.

Sia f ∈ Aut (R). Supponiamo per assurdo che sia f 6= idR. Allora esiste a ∈ R tale che f(a) 6= a, ed esisteq ∈ Q tale che a < q < f(a). Da a < q segue f(a) < q perche f e un automorfismo ordinale (per 5.2.5) ed ffissa ogni numero razionale (per 5.2.6). Dunque f(a) < q < f(a), assurdo.

5.2.9 Gli unici automorfismi continui del campo complesso sono l’identita e il coniugio.

Sia f ∈ Aut (C). Sappiamo che f fissa ogni numero razionale (per 5.2.6) e dunque f(i) = ±i essendof(i)2 = f(i2) = f(−1) = −1. Se l’automorfismo f e anche continuo, allora f fissa ogni numero reale a perchea e limite di una successione di numeri razionali ai e dunque f(a) = f(lim(ai)) = lim(f(ai)) = lim(ai) = a.Ne segue che per ogni numero complesso a + ib si ha f(a + ib) = a + ib oppure f(a + ib) = a− ib a secondache sia f(i)=i oppure f(i)=-i.

5.2.10 L’ordine di un campo finito e potenza di un numero primo.

Sia K un campo finito, con q elementi. La caratteristica di K e un numero primo p ed il campo fondamentaledi K e Zp. Il campo K e uno spazio vettoriale, necessariamente di dimensione finita, diciamo h, sul suocampo fondamentale Zp, e pertanto K e isomorfo (come spazio vettoriale) allo spazio vettoriale delle h-pleordinate di elementi di Zp. Il numero di queste h-ple e ph e quindi K ha altrettanti elementi. Ricordiamoil teorema di esistenza e unicita dei campi finiti : per ogni primo p ≥ 2 e per ogni intero h ≥ 1, esiste, ed eunico a meno di isomorfismi, un campo finito con q = ph elementi. Tale campo si denota con GF (q) (”Galoisfield of order q”) e puo essere ottenuto effettuando una estensione algebrica di Zp rispetto ad un polinomioirriducible su Zp di grado h, certamente esistente per 5.2.15.

5.2.11 Teorema di Lagrange: l’ordine di un sottogruppo di un gruppo finito divide l’ordinedel gruppo.

Sia G un gruppo finito (moltiplicativo) e sia H un suo sottogruppo. L’insieme {aH : a∈ G} delle classilaterali sinistre aH di H in G costituisce una partizione di G (verificare !) ed ogni classe aH ha uno stessonumero | H | di elementi (verificare !). Pertanto il numero degli elementi di G si ottiene moltiplicando ilnumero degli elementi di H per il numero delle classi laterali sinistre di H in G.

5.2.12 Se a e un elemento di un gruppo finito G, si ha a|G| = 1G.

Denotiamo con o(a) l’ordine di a, cioe l’ordine del sottogruppo generato da a. Per il Teorema di Lagrange,o(a) divide | G |. Posto | G |= o(a) · t, si ha a|G| = ao(a)·t = (ao(a))t = (1G)t = 1G.

40

5.2.13 Se a e un elemento non nullo di un campo finito K con q elementi, si ha aq−1 = 1K ,Pertanto aq = a per ogni a ∈ K.

Infatti gli elementi non nulli di K costituiscono un gruppo moltiplicativo con q − 1 elementi, e quindiaq−1 = 1K (per 5.2.12). Moltiplicando entrambi i membri per a, si trova che la relazione aq = a e verificatada ogni elemento non nullo a ∈ K; la stessa relazione e banalmente verificata anche da a = 0K . In particolare,per K = Zp si ottiene il Piccolo Teorema di Fermat: se p e primo e a ∈ N, allora ap ≡ a (mod p);se p e primo e non divide a, allora ap−1 ≡ 1 (mod p).

5.2.14 Un campo finito non e algebricamente chiuso.

Infatti esistono polinomi di grado positivo con coefficienti nel campo privi di zeri nel campo: se il campo haq elementi, il polinomio f(x) = xq − x + 1, e tale che f(a) = aq − a + 1 = a− a + 1 = 1 6= 0 per ogni a ∈ K.

5.2.15 Grado dei polinomi irriducibili sopra un campo.

Sia K un campo. Sia f(X) ∈ K[X] un polinomio di grado deg f(X) ≥ 1. Se deg f(X) = 1, allora f(X)e irriducibile in K[X]; se K e algebricamente chiuso, gli unici polinomi irriducibili di K[X] sono quelli digrado 1 ed ogni polinomio si fattorizza su K in fattori lineari ed ammette tanti zeri in K quanto e il suogrado (a patto di contare ogni zero con la dovuta molteplicita).

Se f(X) ∈ R[X] e irriducibile in R[X], allora deg f(X) ≤ 2: si fattorizzi il polinomio in fattori lineari inC[X] e si noti che ogni zero complesso α si accompagna (con la stessa molteplicita) allo zero coniugato α.Un polinomio f(X) ∈ R[X] di grado dispari ha almeno una radice in R: segue dalla affermazione precedente(ma anche dal fatto che la funzione polinomiale associata f : R → R : a 7→ f(a) e continua ed assume siavalori positivi che valori negativi).

Per ogni intero h ≥ 2, esistono polinomi f(X) ∈ Q[X] di grado h ed ivi irriducibili, ad esempio Xh − pcon p numero primo: infatti, se fosse mh = pnh con m,n ∈ Z si arriverebbe a un assurdo in quanto ilprimo membro conterrebbe il fattore p con esponente congruo a 0 modulo h mentre il secondo membro conesponente congruo ad 1 modulo h; alternativamente si usi il criterio di Eisenstein, di cui si e detto discutendol’irriducibilita su Q del polinomio X3 − 2 in relazione al problema della duplicazione del cubo.

Per ogni intero h ≥ 1, esistono polinomi f(X) ∈ GF (q)[X] di grado h ed ivi irriducibili (si omette ladimostrazione). Si noti che da questo teorema segue subito che per ogni primo p e per ogni intero h ≥ 1esiste un campo finito di ordine ph: e il campo GF (ph) = Zp[X]/(f(X)), dove f(X) e un polinomio di Zp[X]ivi irriducibile e di grado h; ricordiamo che gli elementi di questo campo sono le classi laterali dell’ideale(f(X)) dell’anello Zp[X] cioe le classi resto modulo f(X) e quindi sono in numero di ph che e il numero deipossibili resti a0 + a1X + · · ·+ ah−1 ∈ Zp[X] che si ottengono dividendo i polinomi di Zp[X] per f(X).

5.2.16 Esempio di corpo non commutativo: i quaternioni reali.

Un quaternione reale q e definito come una qualunque espressioni formale

q = a + ib + jc + kd,

dove a, b, c, d sono numeri reali e i, j e k sono puri simboli. Due quaternioni sono uguali sse hanno ordinata-mente gli stessi coefficienti. La somma di due quaternioni, q e q′ = a′ + ib′ + jc′ + kd′ e definita effettuandola somma secondo le regole usuali dell’algebra, cioe assumendo:

41

q + q′ : = (a + a′) + i(b + b′) + j(c + c′) + k(d + d′).

Il prodotto di due quaternioni viene definito effettuando il prodotto delle espressioni formali secondo le regoleusuali dell’algebra e tenendo conto delle seguenti posizioni:

i2 = j2 = k2 = −1, ij = k, jk = i, ki = j, ji = −ij, kj = −jk, ik = −ki.

Dunque: q ·q′ := (aa′−bb′−cc′−dd′)+ i(ab′+ba′+cd′−dc′)+j(ac′+ca′−bd′+db′)+k(ad′+da′+bc′−cb′).I numeri reali ed i numeri complessi sono evidentemente particolari quaternioni; in particolare i numeri 0 eil quaternione nullo ed 1 e il quaternione unita. Il coniugato di q e il quaternione q = a− ib− jc− kd; lanorma di q e il numero reale N(q) := qq = a2 + b2 + c2 + d2. Evidentemente un quaternione e nullo sse hanorma zero; ne segue che ogni quaternione q 6= 0 e invertibile: q−1 = q

N(q) . E facile verificare che l’insiemeH dei quaternioni reali costituisce un corpo non commutativo.Osserviamo che l’anello H[x] dei polinomi a coefficienti quaternioni presenta alcune anomalie rispetto all’anelloR[x] dei polinomi a coefficienti reali. Anzitutto non e vero che ogni polinomio si fattorizza in modo uniconel prodotto di polinomi irriducibili, perche ad esempio il polinomio x2 + 1 ammette le tre fattorizzazionix2 + 1 = (x + i)(x − i) = (x + j)(x − j) = (x + k)(x − k). Inoltre, come mostra questo stesso esempio, none vero che il numero degli zeri di un polinomio non supera il suo grado. Infine, come conseguenza della noncommutativita del prodotto di H, non vale il principio di specializzazione secondo cui ”la specializzazionedel prodotto di due polinomi e il prodotto delle specializzazioni dei fattori”:

0 = [x2 + 1]x=i = [(x + j)(x− j)]x=i 6= [x + j]x=i[x− j]x=i = (i + j)(i− j) = −2k.

5.3 Miscellanea geometrica

5.3.1 Il piano di Fano

. Il piano di Fano (Gino FANO, 1871-1952) e il piano P2(Z2). Esso ha i 7 punti 1(1,0,0), 2(1,1,0), 3(0,1,1),4(0,1,0), 5(1,0,1), 6(0,0,1), 7(1,1,1) e le 7 rette 124: x2 = 0, 235: x1 + x2 + x3 = 0, 346: x0 = 0 , 457:x0 + x2 = 0, 561: x1 = 0, 672: x0 + x1 = 0, 713: x1 + x2 = 0, ciascuna delle quali consiste di trepunti ed ha l’equazione indicata. Per ricostruire quanto detto, conviene partire dall’insieme {1, 2, 3, 4,5, 6, 7 } dei ’punti’ del ’piano’, e dalla ’retta’ iniziale consistente dei tre punti 124; le rimanenti ’rette’ siottengono aggiungendo ripetutamente 1 (modulo 7) a ciascun puinto della retta iniziale. In questo modo sie ottenuto un piano grafico proiettivo (che si chiama il ’piano di Fano’), perche sono verificati gli assiomidi piano proiettivo (per due punti distinti qualsiasi passa un’unica retta, due rette distinte qualsiasi hannoesttamente un punto in comune, esistono almeno tre punti non allineati, ogni retta contiene almeno tre punti).Possiamo successivamente rappresentare graficamente nel piano euclideo il piano di Fano. considerando untriangolo equilatero con un lato orizzontale e situato nel semipiano superiore rispetto al lato. I sette ’punti’sono i tre vertici, i tre punti medi dei lati ed il centro del triangolo; le ’rette’ sono le tre terne di puntisituati sui lati, le tre terne di punti situati sulle mediane e la terna dei punti medi dei lati (punti di tangenzadella circonferenza inscritta). Possiamo poi raccordare le due rappresentazioni indicate per il piano di Fano,denotando i tre punti sul lato di base (procedendo da sinistra) con 124, assumendo 235 nella terna di puntidi tangenza della circonfernza inscritta (percorsa in senso antiorario), assumendo poi 6 nel terzo vertice deltriangolo ed infine assumendo 7 nel centro. In questa rappresentazione grafica, scegliamo un riferimentoproiettivo A0A1A2U assumendo A0 e A1 nei vertici del lato orizzontale del triangolo, A2 nel terzo verticedel triangolo ed U nel centro. Con questa scelta del riferimento, ad ogni punto viene associata la terna(omogenea) di coordinate in Z2 e ogni retta viene rappresentata da una ben determanata equazione, comeindicato all’inizio. ((Il lettore e invitato a fare il disegno, e a etichettare i sette punti della figura nel mododescritto.).

42

5.3.2 Topologia di Zariski

. Consideriamo un fissato spazio affine Ar(K) su un campo K. Un insieme algebrico affine dello spazio,definito da un fissato insieme F di polinomi di K[x1, . . . , xr)], e il luogo V (F ) dei punti dello spazio cheannullano ciascun polinomio di F . Se F e G sono due insiemi di polinomi di K[x1, . . . , xr], si ha V (F )∪(G) =V (F · G), da cui segue per induzione che l’unione di un numero finito di insiemi algebrici e un insiemealgebrico. Inoltre l’intersezione di una qualunque famiglia di insiemi algebrici {V (Fi)}i∈I e un insiemealgebrico perche si ha

⋂i∈I V (Fi) = V (

⋃i∈I Fi). Infine si ha che il vuoto e un insieme algebrico V (F )

associato ad un sistema F incompatibile di polinomi, e l’intero spazio e un insieme algebrico V (0) associatoal polinomio nullo. Le proprieta stabilite mostrano che la famiglia degli insiemi algebrici V (F ) di un fissatospazio affine Ar(K) verifica gli assiomi della famiglia dei chiusi di una topologia. La topologia che ne risultasi chiama la Topologia di Zariski di Ar(K). Analogamente si definisce la Topologia di Zariski di un fissatospazio proiettivo Pr(K), assumendo la famiglia degli insiemi algebrici proiettivi come famiglia dei suoi chiusi.

5.3.3 Un’affinita del piano euclideo che muti un fissato triangolo in un triangolo congruente(risp. simile) e una isometria (risp. similitudine).

Sia f una affinita del piano euclideo E2 e sia T un triangolo che sia congruente al suo trasformato T ′ = f(T ).Poiche i triangoli T e T ′ sono congruenti, esiste una (unica) isometria g di E2 tale che g(T ) = T ′, cfr. laProposizione 23. Poiche f e g sono due affinita che mutano T in T ′, e poiche il gruppo delle affinita di E2 estrettamente 1-transitivo sull’insieme dei triangoli, si ha necessariamente f = g, e dunque f e una isometria.Sia ora f una affinita del piano euclideo E2 e sia T un triangolo che sia simile al suo trasformato T ′ = f(T ).Poiche i triangoli T e T ′ sono simili, esiste una (unica) similitudine g di E2 tale che g(T ) = T ′, cfr. laProposizione 26. Poiche f e g sono due affinita che mutano T in T ′, e poiche il gruppo delle affinita diE2 e strettamente 1-transitivo sull’insieme dei triangoli, si ha necessariamente f = g, e dunque f e unasimilitudine.

5.3.4 Un’affinita del piano euclideo che conservi una fissata distanza d > 0 (risp. che trasformipunti che abbiano tra loro una fissata distanza d > 0 in punti aventi fra loro una fissatadistanza dk) e una isometria (risp. una k-similitudine).

Sia f una affinita del piano euclideo E2 che conservi una fissata distanza d > 0. Vogliamo dimostrare chef conserva tutte le distanze. Sia T un triangolo equilatero di lato d, Allora f trasforma T in un triangoloT ′ = f(T ) equilatero di lato d, dunque congruente a T. In virtu del n. 5.3.3, f e un’isometria.Sia ora f una affinita del piano euclideo E2 che trasformi coppie di punti che abbiano una fissata distanzad > 0 in coppie di punti a distanza dk con k fisso. Sia T un triangolo equilatero di lato d, Allora f trasformaT in un triangolo T ′ = f(T ) equilatero di lato dk, dunque simile a T . In virtu del n. 5.3.3, f e unasimilitudine, e precisamente una k-similitudine.

5.3.5 Triangoli congruenti e isometrie.

Vedremo in questo paragrafo che condizione necessaria e sufficiente affinche due triangoli del piano euclideosiano congruenti e che esista una isometria del piano che muti l’uno nell’altro. La condizione e ovvia-mente sufficiente, perche due triangoli con i lati ordinatamente congruenti sono congruenti. La condizione enecessaria in virtu della seguente Proposizione.

43

Proposizione 23 Siano ABC e A′B′C ′ due triangoli congruenti del piano euclideo E2. Esiste ed e unicauna isometria f ∈ Iso(E2) tale che f(ABC) = A′B′C ′; inoltre tale f e prodotto di al piu tre simmetrierispetto a rette.

Dimostrazione. Per definizione di triangoli congruenti, si ha l’uguaglianza37 del lati: AB = A′B′, BC =B′C ′, AC = A′C ′. Se A′ = A, si assuma f1 = id(E2); se A′ 6= A, si assuma f1 = σa, dove a e l’asse delsegmento AA′. In entrambi i casi si ha ovviamente

f1(A) = A′.

Sia f1(B) = B1, f1(C) = C1. Se B1 = B′ si assuma f2 = id(E2); se B1 6= B′ si assuma f2 = σb, dove b el’asse del segmento B′B1. In entrambi i casi si ha ovviamente

f2(B1) = B′ ed inoltre f2(A′) = A′

perche A′ ∈ b, essendo A′ equidistante dagli estremi del segmento B′B1 in quanto A′B′ = AB = A′B1(=f1(AB)). Sia f2(C1) = C2. Se C2 = C ′ si assuma f3 = id(E2); se C2 6= C ′ si assuma f3 = σc, dove c e l’assedel segmento C2C

′. In entrambi i casi si ha ovviamente

f3(C2) = C ′

ed inoltre

f3(A′) = A′ ed anche f3(B′) = B′

perche c = A′B′, essendo ciascuno dei due punti A′ e B′ equidistante dagli estremi del segmento C2C′ :

A′C ′ = AC = A′C1 = A′C2 e B′C ′ = BC = B1C1 = B′C2. Pertanto, posto f := f3f2f1, si ha:

f(A) = f3f2f1(A) = f3f2(A′) = f3(A′) = A′,

f(B) = f3f2f1(B) = f3f2(B1) = f3(B′) = B′,

f(C) = f3f2f1(C) = f3f2(C1) = f3(C2) = C ′.

Da quanto precede si ha che esiste almeno una isometria che trasforma il triangolo T = ABC nel triangoloT ′ = A′B′C ′ e che tale isometria e prodotto di al piu tre simmetrie; l’unicita dell’isometria in questionesegue dal fatto che essa non puo che coincidere con l’unica affinita di E2 che muta T in T ′.

Osservazione 24 . In base alle notazioni introdotte nella dimostrazione del Teorema 23 si ha: f1(ABC) =A′B1C1, f2(A′B1C1) = A′B′C2, f3(A′B′C2) = A′B′C ′.

Corollario 25 Ogni isometria del piano euclideo e prodotto di al piu tre simmetrie rispetto a rette.

Dimostrazione. Sia f ∈ Iso(E2). Consideriamo un triangolo T ed il suo trasformato T ′ = f(T ). Per ilterzo criterio di uguaglianza i triangoli T e T ′ sono congruenti . Dunque, per la Proposizione 23, f non puoche coincidere con l’unica isometria che muta T in T ′ e che sappiamo essere prodotto di al piu tre simmetrie.

37Qui e appresso usiamo impropriamente, per segmenti, angoli e triangoli, il termine uguaglianza per indicare la congruenzaed il simbolo = in luogo di ≡.

44

5.3.6 Triangoli simili e similitudini.

Vedremo in questo paragrafo che condizione necessaria e sufficiente affinche due triangoli del piano euclideosiano simili e che esista una similitudine del piano che muti l’uno nell’altro. La condizione e ovviamentesufficiente, perche due triangoli con i lati in proporzione sono simili. La condizione e necessaria in virtu dellaseguente Proposizione.

Proposizione 26 Siano ABC e A′B′C ′ due triangoli simili del piano euclideo E2. Esiste ed e unica unasimilitudine f ∈ Sim(E2) tale che f(ABC) = A′B′C ′.

Dimostrazione. Sia τ la traslazione tale che τ(A) = A′, e sia ρ la rotazione di centro A′ che porta lasemiretta A′τ(B) sopra la semiretta A′B′; sia infine ω l’omotetia di centro A′ che porta ρτ(B) in B′. I trian-goli A′B′C ′ e ωρτ(ABC) = A′B′ωρτ(C) sono congruenti per il terzo criterio di uguaglianza ed hanno il latoA′B′ in comune. Due casi sono possibili a seconda che i due punti ωρτ(C) e C ′ siano o non siano nello stessosemipiano di origine la retta A′B′: nel primo caso ωρτ(C) = C ′, mentre nel secondo caso C ′ = σωρτ(C),dove σ e la simmetria rispetto alla retta A′B′. In conclusione il triangolo ABC viene portato nel triangoloA′B′C ′ dalla similitudine diretta ωρτ nel primo caso oppure dalla similitudine inversa σωρτ nel secondocaso. In entrambi i casi esiste una similitudine che porta il triangolo ABC nel triangolo A′B′C ′; inoltre talesimilitudine e unica, perche dati due triangoli qualunque esiste ed e unica l’affinita che muta il primo nelsecondo.

6 Ampliamenti, estensioni e generalizzazioni dello spazio della ge-ometria elementare

.

Lo studio della geometria lineare ed algebrica suggerisce in modo spontaneo varie estensioni e generaliz-zazioni della nozione di spazio, allo scopo di eliminare le eccezioni che si incontrano e di trovare un linguaggioper quanto possibile unificatore.

Ci limitiamo per il momento al punto di vista della geometria lineare ed algebrica, in quanto esso riflettele proprieta generali di campo: prescinderemo invece dal punto di vista metrico e differenziale, che e legatoa proprieta specifiche e piu riposte del campo reale, quali l’ordinamento e la continuita).

Ci proponiamo di motivare tre tipi di ampliamenti:

(1) ampliamenti del campo base;(2) passaggio dall’affine al proiettivo;(3) passaggio a spazi di dimensione superiore.

Appare altamente desiderabile estendere il piano R2 in modo che, nell’ambiente esteso, valga senzaeccezioni il Teorema di Bezout (Etienne BEZOUT, 1730-1783), secondo cui due qualunque curve al-gebriche, che non abbiano una componente comune, si intersecano in un numero di punti che uguaglia ilprodotto dei loro ordini (purche ogni punto comune alle due curve venga contato con la dovuta molteplicitad’intersezione). Si raggiunge lo scopo desiderato, passando dal reale al complesso e dall’affine al proiettivo.In altri termini, dovremo sviluppare la geometria del piano proiettivo complesso.

45

Vedremo poi che, anche se ci si vuole limitare a studiare la geometria elementare, si e costretti a studiare(eventualmente in modo inconsapevole) la geometria algebrica in uno spazio di dimensione superiore:cosı, ad esempio, la semplicissima geometria della retta dello spazio ordinario equivale alla geometriadella quadrica di Klein V 2

4 (un’ipersuperficie d’ordine 2 di uno spazio di dimensione 5). Analogamente,vedremo che le coniche del piano corrispondono ai punti di uno spazio S 5-dimensionale, che le conichespezzate corrispondono ai punti di una ipersuperficie cubica V 3

4 di tale S5, e che le coniche spezzate inuna retta contata due volte corrispondono ai punti di una superficie di S5, la superficie di Veronese V 4

2 .Vedremo anche che la superficie di Veronese puo essere presentata come immagine proiettiva del sistemalineare completo delle coniche del piano, e che questi punti di vista potranno essere estesi alla considerazionedella varieta di Veronese rappresentativa del sistema lineare totale delle curve algebriche piane d’ordinen (o piu generalmente della varieta di Veronese rappresentativa del sistema lineare totale delle ipersuperficialgebriche d’ordine n di uno spazio proiettivo di dimensione r ≥ 2).

Avremo in definitiva motivazioni piu che sufficienti per giustificare lo studio della geometria proiettivaiperpaziale.

Per illustrare nel modo piu semplice possibile l’opportunita di effettuare le estensioni suddette, partiamoanzitutto dall’usuale spazio a due dimensioni (il piano di Euclide). Sappiamo che, come modello del pianoeuclideo, possiamo assumere il piano numerico reale A2(R) = (P,R). In tale spazio, l’insieme P dei puntie l’insieme R2 delle coppie ordinate di numeri reali. L’insieme R delle rette e:

R := {rabc : (a, b, c) ∈ R3, (a, b) 6= (0, 0)},

ove la retta rabc e data da:rabc := {(x, y) ∈ R2 : ax + by + c = 0}.

Talvolta, per abuso di notazione, il piano numerico reale verra denotato semplicemente con R2. In taleambiente, oltre all’ordinaria geometria lineare (traduzione dell’algebra lineare, riguardante i sistemi diequazioni lineari), si sviluppa piu generalmente la geometria algebrica piana (studio delle curve algebrichepiane, traduzione dello studio dei polinomi e dei sistemi di polinomi in due indeterminate). Ricordiamo chesi definisce curva algebrica di R2 di grado (o ordine) d ≥ 1 una qualunque coppia V(f) = (R? ·f, V (f)), dovef = f(X, Y ) ∈ R[X, Y ] e un polinomio di grado d, e V (f) (detto il sostegno o supporto della curva) el’insieme dei punti di R2 che annullano f :

V (f) := {(x, y) ∈ R2 : f(x, y) = 0}.

Diremo anche che V(f) e la curva definita dall’equazione f(X, Y ) = 0. Si noti che curve distinte possonoavere lo stesso sostegno: ad esempio V (XY ) = V (XY 2) = V (X2Y ) = V (X3Y 5) e il comune sostegno dicurve fra loro distinte.

6.1 Ampliamento del campo base: passaggio dal reale al complesso

Questo ampliamento puo essere effettuato in due modi:(1) Passaggio dal piano reale al piano reale complessificato: Cio significa che il campo base

(campo ove variano i coefficienti delle equazioni algebriche che si considerano) e il campo reale, ma siconsente alle coordinate dei punti soluzione di assumere valori complessi. Ad esempio, l’insieme delle rettee ora

R := {rabc : (a, b, c) ∈ R3, (a, b) 6= (0, 0)},

ove la retta rabc e ora data da:

rabc := {(x, y) ∈ C2 : ax + by + c = 0}.

46

(2) Passaggio al piano complesso. Cio significa che sia i coefficienti delle equazioni considerate sia lecoordinate dei punti variano nel campo complesso. Ad esempio, l’insieme delle rette e ora

R := {rabc : (a, b, c) ∈ C3, (a, b) 6= (0, 0)},

ove la retta rabc e ora data da:

rabc := {(x, y) ∈ C2 : ax + by + c = 0}.

Per conseguire la validita del teorema di Bezout, il passaggio dal reale al complesso e neces-sario: si consideri V(X2 + Y 2 − 1) ∩ V(X − 2) = {(2, i

√3), (2,−i

√3)}; ma non e sufficiente: si consideri

V(X − 1) ∩ V (X − 2) = ∅.

Notiamo ancora una volta che i punti comuni vanno contati con la dovuta molteplicita d’intersezione:ad esempio: V(X2 + Y 2− 1)∩V(X − 1) = {(1, 0)}, e questo punto va contato due volte perche la retta e ivitangente alla circonferenza.

Osservazione. Si noti che, nello studio di questioni aritmetiche ed in teoria dei numeri, si usa andarenella direzione contraria: anziche ampliare il campo reale R, ci si restringe al campo razionale Q. Adesempio, l’esistenza di terne pitagoriche equivale all’esistenza nel primo quadrante di punti razionalisulla circonferenza X2 + Y 2 = 1 di centro l’origine e raggio 1: se (a, b, c) ∈ N3 e una terna pitagorica, cioese a2 + b2 = c2, allora (a/c)2 + (b/c)2 = 1, ossia (a/c, b/c) e un punto razionale del tipo detto; viceversase (p, q) ∈ Q2 e un punto razionale del tipo detto, si ha p2 + q2 = 1, e posto che sia p = a/b, q = c/d,con (a, b, c, d) ∈ N4, si ha (a/b)2 + (c/d)2 = 1, cioe a2d2 + c2b2 = b2d2, e si trova la terna pitagorica(ad, cb, bd). In modo analogo si riconosce subito che l’esistenza di terne di Fermat di ordine n > 2 - cioe diterne (a, b, c) ∈ N3 tali che an + bn = cn - equivarrebbe all’esistenza nel primo quadrante di punti razionalisulla curva algebrica di equazione Xn + Y n = 1. Il cosiddetto grande (o ultimo) teorema di Fermat,affermante che non esistono terne di Fermat d’ordine n > 2, e stato dimostrato soltanto nel 1993 (da AndrewWILES, medaglia Fields38).

Ricordiamo infine che, mentre non esistono ovviamente campi intermedi tra il campo reale ed il campocomplesso, esistono invece infiniti campi intermedi tra il campo reale ed il campo razionale, bastando adesempio effettuare, a partire da Q, successive estensioni semplici (algebriche o trascendenti) entro R.

6.2 Passaggio dall’affine al proiettivo.

6.2.1 Dal piano affine A2(R) al piano proiettivo P2(R).

Tale ampliamento ha anzitutto un valore unificante (ad es. due rette del piano avranno sempre un punto incomune, proprio o improprio). Si puo distinguere tra piano affine ampliato e piano proiettivo vero eproprio, a seconda che venga o no conservata memoria del piano affine originario. Ad esempio la distinzionetra punti propri ed impropri ha senso nel piano affine ampliato, ma non nel piano proiettivo (nel quale tuttii punti sono uguali!), la considerazione della retta impropria ha senso nel piano affine ampliato, ma non nelpiano proiettivo (nel quale tutte le rette sono uguali!). La distinzione diviene piu chiara se si adotta il puntodi vista di Klein: la geometria affine del piano affine ampliato ha come gruppo fondamentale il gruppo delleomografie che mutano in se la retta impropria, mentre la geometria proiettiva (del;piano proiettivo) ha comegruppo fondamentale il gruppo di tutte le omografie. Ricordiamo che, il passaggio dal piano affine al piano

38Le medaglie Fields (che prendono il nome da J.C. Fields, che ha finanziato la loro istituzione) sono premi equivalenti per lamatematica ad un premio Nobel e vengono assegnati - in occasione del Congresso Internazionale dei Matematici (ogni quattroanni) - a matematici con meno di quaranta anni che si siano distinti per avere ottenuto risultati particolarmente importanti.

47

proiettivo puo essere descritto in due modi diversi (fra loro equivalenti): uno sintetico ed uno analitico. Ilmodo sintetico consiste dei seguenti passi:

(1) si introduce per ogni fascio di rette parallele un nuovo ”punto, che e la comune direzione delle rettedi quel fascio, cioe il quid comune alle rette del fascio (ovvero, se si preferisce, il fascio stesso, qualora sipreferisca l’aspetto estensivo a quello intensivo del concetto di direzione);(2) si amplia ciascuna retta con l’aggiunta di un nuovo punto: la direzione di quella retta;(3) si introduce una nuova retta: la totalita delle direzioni delle rette del piano.

Quando si mantiene la memoria del processo di ampliamento, i vecchi elementi - punti e rette - sichiamano propri (o al finito), mentre i nuovi vengono chiamati impropri (o all’infinito); la terminologiasi giustifica osservando che quando due rette incidenti del piano euclideo variano con continuita tendendo adessere parallele, il loro punto d’intersezione si allontana indefinitamente.

Si noti che gli assiomi di incidenza per un piano proiettivo sono particolarmente semplici ed eleganti. Unpiano proiettivo e una coppia P2 = (P,R), dove P e un insieme non vuoto di elementi detti punti, R e uninsieme di parti di P dette rette, in modo che valgano i seguenti assiomi:

1) Per due punti distinti qualunque passa una e una sola retta.2) Due rette distinte qualunque si intersecano in uno ed in un solo punto.3) Esistono 4 punti a 3 a 3 non allineati.

Il terzo assioma puo essere sostituito da:

3’) Esistono almeno 3 punti non allineati e (proprieta di Fano39) ogni retta contiene almeno 3 punti.

Si noti che la nozione di piano proiettivo e nella natura delle cose. Infatti si ha un piano proiettivoP2 = (P,R), assumendo come P la stella di rette di R3 di centro un punto A ∈ R3 e come R la stella dipiani di R3 di centro A. Si noti che tale piano P2 e isomorfo al piano P2(R) (visto come piano all’infinito diR3, i cui punti sono le direzioni delle rette della stella e le cui rette sono le giaciture dei piani della stella).Si noti inoltre che ogni piano della stella si puo identificare con il fascio di rette di centro A contenuto nelpiano stesso.

In modo analitico l’ampliamento del piano affine R2 = A2(R) = AG(2, R) al piano proiettivo P2(R) =PG(2, R) viene descritto dai seguenti passi.

1) I punti di P2(R) sono le ”terne omogenee” di numeri reali. Ogni terna omogenea si ottiene da unaterna ordinata (x0, x1, x2) di numeri reali non tutti nulli, e consiste per definizione di quella terna stessa edi tutte le altre terne proporzionali a quella secondo fattori non nulli di R). La terna omogenea associata a(x0, x1, x2) si denota con [(x0, x1, x2)].

2) Le rette di P2(R) sono gli insiemi di punti del tipo:

rabc = {[(x0, x1, x2)] : ax1 + bx2 + cx0 = 0}

ove (a, b, c) e una terna di numeri reali non tutti nulli. Si noti che attualmente non si richiede che sia(a, b) 6= (0, 0).

3) I punti di A2(R) si identificano con alcuni punti di P2(R). Piu precisamente il punto (x, y) di A2(R)si identifica con il punto [(1, x, y)] di P2(R). In altri termini: ogni punto [(x0, x1, x2)] di P2(R) con x0 6= 0 siidentifica col punto (x, y) ove x = x1/x0, y = x2/x0.

Ad ogni retta di A2(R) di equazione aX + bY + c = 0 (dove a, b sono non entrambi nulli) corrisponde cosıla retta di P2(R) di equazione aX1 + bX2 + cX0 = 0. Ogni soluzione (x, y) di quella fornisce una soluzioneomogenea [(1, x, y)] di questa; questa ha poi un’unica ulteriore soluzione [(0,−b, a)]. In altri termini la

39Il matematico Gino FANO (1871-1952) e stato gia ricordato a proposito del piano proiettivo P2(Z2), che porta il suo nome.

48

retta di A2(R) e stata ampliata con l’aggiunta del punto [(0,−b, a)]. Questo punto corrisponde al puntoimproprio di cui si e detto nella esposizione per via sintetica, perche la condizione di parallelismo tra duerette di A2(R) aventi rispettivamente equazione aX + bY + c = 0 ed a′X + b′Y + c′ = 0 si traduce (in basea proprieta elementari dei sistemi di equazioni lineari) nella proporzionalita delle coppie (a, b) e (a′, b′) cioenel fatto che sia [(0,−b, a)] = [(0,−b′, a′)].

6.2.2 Curve algebriche del piano proiettivo A2(R).

Ricordiamo che si definisce curva algebrica di P2(R) di grado (o ordine) d ≥ 1 una qualunque coppiaV(f) = (R?f, V (f)), dove f = f(X) = f(X0, X1, X2) ∈ R[X0, X1, X2] = R[X] e un polinomio omogeneo digrado d, e V(f) (detto il sostegno della curva) e l’insieme dei punti [(x0, x1, x2)] di P2(R) che annullano f :

V (f) := {[x] : x ∈ R3 ∧ f(x) = 0}.

,

Le curve algebriche di ordine 1 sono le rette, le curve algebriche di ordine 2, 3, 4, . . . si chiamano coniche,cubiche, quartiche, quintiche . . . .

E’ chiaro che ad ogni curva algebrica di grado d del piano affine A2(R), di equazione f(X, Y ) = 0, si puoassociare la curva algebrica di grado d di P2(R), di equazione

Xd0f(X1/X0, X2/X0) = 0.

Viceversa, ad ogni curva algebrica di grado d di P2(R), di equazione f(X0, X1, X2) = 0 puo associArsila sua traccia affine, che sara una curva algebrica di A2(R), di equazione f(1, X, Y ) = 0, non appena ilpolinomio f non contenga il fattore Xd

0 , cioe non appena la curva non consista della retta impropria contatad volte.

Per conseguire la validita del teorema di Bezout, il passaggio dall’affine al proiettivo enecessario (ad esempio V (X−1)∩V (X−2) = ∅ in ambito affine, mentre V (X−1)∩V (X−2) = {(0, 0, 1)}in ambito proiettivo), ma non e sufficiente (ad esempio V(X2 + Y 2 − 1) ∩ V (X − 2) = ∅ sia in ambitoaffine che proiettivo).

Da quanto precede si ha che, per conseguire la validita del teorema di Bezout, e necessario il passaggiodal reale al complesso e dall’affine al proiettivo. In effetti quelle due condizioni (prese insieme) sono an-che sufficienti, in quanto si puo effettivamente dimostrare (con la teoria dell’eliminazione algebrica, e piuprecisalmente con la teoria del risultante) che

Teorema 27 (Teorema di Bezout nel piano). Sia P2 = P2(K) il piano proiettivo su un campo Kalgebricamente chiuso. Due curve algebriche di P2, di gradi n ed m, che non abbiano una componentecomune, hanno esattamente nm punti in comune, a patto di contare ogni punto d’intersezione con la dovutamolteplicita d’intersezione. I punti distinti sono esattamente nm se le due curve sono generiche40.

40L’attributo generico ha in geometria algebrica un significato tecnico, diverso da vquello che ha l’attributo qualunque.Considerata una certa totalita di enti geometrici, totalita che abbia una certa dimensione k, si dice che ”il generico enteverifica una certa proprieta’ se la totalita degli enti che non verificano quella proprieta costituisce una sottototalita didimensione minore di k. Dunque il significato di ”generico” e relativo ad una certa proprieta e cambia di volta in volta.Ad esempio: ”sia V(f) un’ipersuperficie di Pr(K). Il generico punto di Pr(K) non appartiene a V(f)”: in effetti i punti cheappartengono a V(f) formano una totalita di dimensione r− 1 < r. Ed ancora: ”la generica conica del piano e non singolare”:in effetti la totalita delle coniche singolari ha dimensione 4 < 5.

49

Deduzione del Teorema di Bezout dal principio di conservazione del numero di intersezioni.Nel caso in cui K = C, il suddetto teorema di Bezout puo essere dedotto dal cosiddetto principio diconservazione del numero di intersezioni per variazioni continue: variando con continuita ed inmodo generico le due curve (cioe i coefficienti delle rispettive equazioni) anche i punti d’intersezione varianocon continuita ed il loro numero rimane invariato. Nel caso in questione, si fa degenerare la prima curvain una curva spezzata in n rette generiche e la seconda curva in una curva spezzata in m rette generiche.Il numero dei punti comuni a queste due curve spezzate e dunque nm , ed e uguale al numero dei punticomuni alle due curve originarie. Da questo punto di vista la molteplicita d’intersezione di due curve in unloro punto comune acquista un chiaro significato dinamico come il numero dei punti comuni alle due curvespezzate in rette che confluiscono nel punto in questione (nella trasformazione inversa, che riporta le duecurve spezzate in rette nelle due curve originarie).

6.2.3 Dallo spazio affine A3(R) allo spazio proiettivo P3(R).

Lasciamo al Lettore di descrivere il passaggio dallo spazio affine reale A3(R) allo spazio complessificatoed allo spazio complesso A3(C), seguendo le indicazione sviluppate nel caso piano. Limitiamoci invece aripercorrere il passaggio dall’affine al proiettivo per lo spazio reale 3-dimensionale.

In analogia a quanto detto nal caso del piano, si hanno due modi diversi (fra loro equivalenti), uno pervia sintetica ed uno per via analitica, per passare dallo spazio affine ordinario A3 = A3(R) al corrispondentespazio proiettivo P3 = P3(R). Per quanto riguarda A3, ricordiamo che esso e stato introdotto per via sinteticacon gli assiomi di Hilbert, mentre e stato presentato per via puramente analitica, cioe come spazio numerico,nella dimostrazione del Teorema 2.

Il modo sintetico per passare da A3 a P3 consiste dei seguenti passi:(1) si introduce per ogni stella di rette parallele (stella impropria di rette) un nuovo ”punto” (improprio): lacomune direzione delle rette di quella stella;(2) si amplia ciascuna retta con l’aggiunta di un nuovo punto (improprio): la direzione di quella retta;(3) si amplia ciascun piano con l’aggiunta di nuovi punti (impropri): le direzioni delle rette del piano e conl’aggiunta di una nuova retta (impropria): la totalita delle direzioni delle rette del piano (detta anche la”giacitura” del piano);(4) si constata che due piani sono paralleli se e solo se ad essi compete la stessa retta impropria (cioe sehanno la stessa giacitura).

Il modo analitico per passare da A3(R) a P3(R) consiste dei seguenti passi:

1) I punti di P3(R) sono le ”quaterne omogenee” di numeri reali. Ogni quaterna omogenea e definitacome [x] = x · R?, dove x = (x0, x1, x2, x3) ∈ R4 \ {0} e una quaterna ordinata di numeri reali non tuttinulli.

2) I piani di P3(R) sono gli insiemi di punti del tipo

πabcd := {[(x0, x1, x2, x3)] : ax1 + bx2 + cx3 + dx0 = 0,

ove (a, b, c, d) ∈ R4 ed (a, b, c, d) 6= (0, 0, 0, 0). Si noti che attualmente non si richiede che sia (a, b, c) 6= (0, 0, 0).

50

3) Le rette di P3(R) sono le intersezioni πabcd ∩ πa′b′c′d′ di due piani distinti: essere distinti si traducenel fatto che le quaterne (a, b, c, d) ed (a′, b′, c′, d′) non sono proporzionali; si noti che attualmente non emai πabcd ∩ π′a′b′c′d′ = ∅. In altri termini le rette sono i luoghi dei punti che annullano un sistema lineareomogeneo di rango 2 del tipo:

aX1 + bX2 + cX3 + dX0 = 0, a′X1 + b′X2 + c′X3 + d′X0 = 0.

4) Ciascun punto (x, y, z) di A3(R) si identifica col punto [(1, x, y, z)] di P3(R). In altri termini: ogni punto[(x0, x1, x2, x3)] di P3(R)) con x0 6= 0 si identifica col punto (x, y, z) ove x = x1/x0, y = x2/x0, z = x3/x0.Ad ogni piano di A3(R) di equazione aX + bY + cZ + d = 0 (dove a, b, c sono non tutti nulli) corrispondecosı il piano di P3(R) di equazione omogenea aX1 + bX2 + cX3 + dX0 = 0. Ogni soluzione (x, y, z) di quellafornisce una soluzione omogenea [(1, x, y, z)] di questa; le altre soluzioni dell’equazione omogenea sono tuttee sole le soluzioni del sistema:

aX1 + bX2 + cX3 = 0, X0 = 0

cioe sono i punti di una retta del piano considerato (la retta impropria del piano).

Due piani di A3(R), di equazione rispettivamente aX + bY + cZ + d = 0 e a′X + b′Y + c′Z + d′ = 0,sono paralleli sse coincidono o hanno intersezione vuota, cioe sse le loro due equazioni sono equivalenti oincompatibili; queste due circostanze si verificano sse la terna (a, b, c) e proporzionale alla terna (a′, b′, c′),cioe sse il sistema

aX1 + bX2 + cX3 = 0, X0 = 0 e equivalente al sistema a′X1 + b′X2 + c′X3 = 0, X0 = 0

cioe sse i due piani (ampliati) hanno la stessa retta impropria.In modo analogo si verifica che due rette di A3(R) sono parallele sse le due rette (ampliate) hanno uno

stesso punto improprio (0, x1, x2, x3).

6.2.4 Curve, superfici e varieta algebriche degli spazi A3(R)) e P3(R).

Ricordiamo che si definisce superficie algebrica di A3(R) di grado (o ordine) d ≥ 1 una qualunque coppiaV(f) = (R?f, V (f)), dove f = f(X, Y, Z)[X, Y, Z] e un polinomio di grado d, e V (f) (detto il sostegno dellasuperfice) e l’insieme dei punti (x, y, z) di R3 (o, piu generalmente, di C3) che annullano f :

V (f) := {(x, y, z) ∈ C3 : f(x, y, z) = 0}.

Analogamente si definisce superficie algebrica di P3(R) di grado (o ordine) d ≥ 1 una qualunquecoppia V(f) = (R?f, V (f)), dove f = f(X) = f(X0, X1, X2, X3) ∈ R[X0, X1, X2, X3] = R[X] e un polinomioomogeneo di grado d e V (f) (detto il sostegno della superficie) e l’insieme dei punti [(x0, x1, x2, x3)] diP3(R) (o piu generalmente di P3(C)) che annullano f :

51

V (f) := {[x] : x ∈ C4 ∧ f(x) = 0}.

Le varieta algebriche di A3(R) e di A3(C) si definiscono come intersezioni - considerate nello spazioproiettivo complessificato - di s ≥ 1 superfici algebriche V(fi) di quegli spazi:

⋂i

V(fi) =⋂i

(R?fi, V (fi)) = ({R?fi},⋂i

V (fi)).

In altri termini, per dare una varieta algebrica dobbiamo assegnare un insieme F di polinomi f nelle co-ordinate correnti dello spazio (ciascun polinomio dovra essere omogeneo, se siamo nel caso proiettivo), edassumiamo poi, come varieta definita da F , la coppia

V(F ) = (R?F, V (F )), dove V (F ) =⋂

f∈F

V (f),

l’intersezione essendo estesa a tutti i polinomi f di F .

Una varieta algebrica potra dunque essere: vuota (ad esempio l’intersezione di 4 piani generici di P3),un gruppo finito di punti (ad. esempio l’intersezione di 3 piani generici di P3; od ancora l’intersezionedi una quadrica e di 2 piani generici); una superficie algebrica (quando le superfici considerate hannouna componente superficiale comune, ad esempio la superficie cubica X3

0 −X31 = 0 e la superficie quintica

X50 −X5

1 = 0); una curva algebrica.Le curve algebriche di P3(C) sono per definizione le varieta algebriche di dimensione 1, cioe - per

definizione - quelle varieta algebriche che hanno intersezione non vuota con ogni piano ma non con ogniretta di P3(C); si dimostra che, allora, il generico piano incontra la curva in un numero fisso di punti(contando i punti con la dovuta molteplicita d’intersezione). Ad esempio, la cubica sghemba di A3(R),avente equazioni parametriche X = t, Y = t2, Z = t3, e una curva algebrica, non e contenuta in alcun pianoed ha ordine 3. Infatti i punti comuni alla curva e ad un piano generico d’equazione aX + bY + cZ + d = 0sono esattamentre tre, in quanto si trovano risolvendo in t l’equazione at + bt2 + ct3 + d = 0; inoltre la curvae intersezione delle quadriche di equazioni X2 − Y = 0 ed XY − Z = 0 rispettivamente. Si noti che inP3(C) le due suddette quadriche hanno equazione X2

1 −X2X0 = 0 ed X1X2 −X3X0 = 0 rispettivamente, esi intersecano (a norma del teorema spaziale di Bezout) in una curva di ordine 4, che risulta spezzata nellasuddetta cubica sghemba e nella retta (del piano improprio) di equazioni X0 = 0, X1 = 0.

Anche nello spazio, come nel piano, ai fini della validita del teorema di Bezout occorre e basta ampliarelo spazio A3(R) passando allo spazio proiettivo e al campo complesso. Sussiste infatti il teorema:

Teorema 28 (Teorema di Bezout nello spazio.) Sia P3 = P3(K) lo spazio proiettivo 3-dimensionalesu un campo K algebricamente chiuso. Allora: tre superfici algebriche di P3, di gradi n, m ed h, prive dicomponenti comuni e che non passino per una medesima curva, hanno esattamente nmh punti in comune, apatto di contare ogni punto d’intersezione con la dovuta molteplicita d’intersezione. Il numero dei punticomuni e esattamente nmh qualora le tre superfici sono generiche. �

Corollario 29 Sia P3 = P3(K) lo spazio proiettivo 3-dimensionale su un campo K algebricamentechiuso. Allora: due superfici algebriche di P3, di gradi n ed m e prive di componenti superficiali comuni,si intersecano in una curva algebrica d’ordine nm di P3.

Dimostrazione. Si applichi il Teorema di Bezout (Teorema 28) alle tre superfici costituite dalle duesuperfici date e da un piano generico dello spazio. �

52

Deduzione del teorema di Bezout spaziale dal principio di conservazione del numero diintersezioni. Nel caso in cui K = C, il suddetto Teorema di Bezout in P3(K) puo essere dedotto dalprincipio di conservazione del numero di intersezioni per variazioni continue generiche. Le tresuperfici f1, f2 e f3 si fanno degenerare, per variazione continua generica, in tre superfici g1, g2 e g3 ,spezzate rispettivamente in n , in m ed in h piani. Allora g1 ∩ g2 consiste evidentemente di nm rette,cosicche (g1 ∩ g2) ∩ g3 consiste di nmh punti. I punti di (f1 ∩ f2) ∩ f3 sono altrettanti. Questo punto divista da un significato dinamico alla molteplicita d’intersezione delle tre superfici f1, f2ef3 in un loro puntocomune.

6.3 Passaggio a spazi di dimensione superiore.

Si e visto precedentemente che e opportuno sviluppare la geometria in ambiente proiettivo coordinatizzatosopra un campo algebricamente chiuso. Vogliamo ora illustrare la necessita intrinseca di considerareanche spazi di dimensione maggiore di tre, e mostrare come il passaggio a spazi di dimensione superioresia quanto mai naturale. A tal fine cominciamo con il fissare la terminologia e le notazioni relative a talispazi.

6.3.1 Spazio affine Ar(K).

Sia Ar = Ar(K) = (P,S) lo spazio affine numerico r-dimensionale su un campo K (algebricamente chiuso).I punti di Ar sono le r-ple ordinate y = (y1, . . . , yr) di numeri di K: cioe P = Kr. I numeri y1, . . . , yr sichiamano le coordinate affini (c.a.) del punto y. Gli iperpiani sono i luoghi H dei punti (y1, . . . , yr) ∈ Pche verificano un’equazione lineare del tipo:

H : u1Y1 + · · ·+ urYr + u0 = 0,

dove (u0, . . . , ur) ∈ Kr+1 e (u1, . . . , ur) 6= (0, . . . , 0). Piu in generale i sottospazi sono le intersezioni diiperpiani, ossia i luoghi A dei punti (y1, . . . , yr) ∈ P che verificano un sistema di s ≥ 1 equazioni del tipo:

A : u11Y1 + · · ·+ u1rYr + u10 = 0, . . . , us1Y1 + · · ·+ usrYr + us0 = 0. (4)

Una ipersuperficie di Ar(K) e una coppia V(f) = (K?f, V (f)), dove f e un polinomio su K in rindeterminate, f = f(Y) ∈ K[Y] con Y = (Y1, . . . , Yr) e V (f), detto il sostegno dell’ipersuperficie, el’insieme dei punti che annullano f :

V (f) := {(y1, . . . , yr) ∈ P : f(y1, . . . , yr) = 0}.

Si dice che V(f) e l’ipersuperficie definita dal polinomio f (o dall’equazione f = 0).

Una varieta algebrica di Ar si definisce come intersezione di ipersuperfici algebriche. In altri termini,per dare una varieta algebrica, si deve anzitutto assegnare un insieme F di polinomi f(Y) ∈ K[Y] =K[Y1, . . . , Yr] nelle coordinate correnti dello spazio; si chiama allora varieta definita da F la coppia

V(F ) = (K?F, V (F )), dove K?F = {af : a ∈ K?, f ∈ F} e V (F ) =⋂

f∈F

V (f)

53

,

l’intersezione essendo estesa a tutti i polinomi f di F .

Due varieta algebriche di Ar(K):

V(F ) = (K?F, V (F ) e V(F ′) = (K?F ′, V (F ′))

devono attualmente essere considerate equivalenti o ”uguali” dal punto di vista affine), se esisteun’affinita α di Ar tale che α(F ) = F ′, e quindi tale che α(V (F )) = V (F ′)). Ricordiamo che un’affinita diAr(K) ha equazioni

Y′

1 = a11Y1 + · · ·+ a1rY r + a10, . . . , Y′

r = ar1Y1 + · · ·+ arrYr + ar0

,

dove la matrice dei coefficienti e una matrice invertibile ad elementi in K, cioe appartenente al gruppoGL(r, K) ed (a10, . . . , ar0) ∈ Kr.

Un insieme di punti di Ar che sia sostegno V (F ) di una varieta algebrica V(F ) si chiama anche un insiemealgebrico affine di Ar. La totalita degli insiemi algebrici affini di Ar e chiusa rispetto all’intersezione edall’unione, e cio permette di definire l’intersezione e l’unione di varieta algebriche. Infatti, consideratidue insiemi (finiti) F e G di polinomi di K[Y], si ha:

V (F ) ∩ V (G) = V (F ∪G) e V (F ) ∪ V (G) = V (FG), ove FG = {fg : f ∈ F ∧ g ∈ G}.

Si noti che ogni iperpiano di Ar e un’ipersuperficie di Ar. Piu generalmente, ogni sottospazio di Ar e(sostegno di) una varieta algebrica di Ar.

E’ opportuno distinguere tra la varieta V(F ) e il suo sostegno V (F ), in quanto la considerazione di Fpermette di introdurre la nozione (algebrica) di molteplicita delle ”componenti” di V (F ).

Un insieme algebrico V (F ) di Ar si dice riducibile o irriducibile a seconda che esistano o no due insiemialgebrici V (F1) e V (F2) contenuti propriamente in V (F ) tali che V (F ) = V (F1) ∪ V (F2).

Si puo dimostrare che ogni insieme algebrico V (F ) puo scriversi in modo unico (a meno dell’ordine)come unione di un numero finito (diciamo t) di insiemi algebrici irriducibili, V (Fi), detti le sue componentiirriducibili:

V (F ) = V (F1) ∪ V (F2) ∪ · · · ∪ V (Ft).

Se V = (K?F, V (F )) e una varieta algebrica, e se V (Fi) e una componente irriducibile del suo sostegno, lavarieta Vi = (K?Fi, V (Fi)) si chiama una componente irriducibile di V. Si dimostra che rimane definitoun intero mi, detto la moleplicita di V (Fi) in V, e che il dato (V (Fi),mi) equivale ad una varieta algebricaV(Gi), che verra denotata anche con miV (Fi); scriveremo allora:

V = m1V (F1) ∪m2V (F2) ∪ · · · ∪mtV (Ft).

54

In conclusione, ogni varieta algebrica determina, in modo essenzialmente unico, le sue componenti ir-riducibili, con le relative molteplicita.

6.3.2 Spazio proiettivo Pr(K).

Sia Pr = Pr(K) = (P,S) lo spazio proiettivo numerico r-dimensionale su un campo K (algebrica-mente chiuso). I punti di Pr sono le (r + 1)-ple omogenee di numeri di K. Ogni tale (r + 1)-pla omogeneae definita come P (x) = [x] = xK?, dove x = (x0, . . . , xr) e una (r + 1)-pla ordinata di numeri di Knon tutti nulli, chiamati le coordinate proiettive omogenee (c.p.o.) del punto P (x). Si scrive ancheP (x) = (x0 : · · · : xr), per esprimere che il punto P (x) e determinato dai mutui rapporti delle sue c.p.o. CosıP = {P (x) : x ∈ Kr+1 \0. In altri termini i punti P (x) di Pr sono le classi di equivalenza xK? di vettori nonnulli x dello spazio vettoriale Kr+1. Cio consente di trasportare allo spazio proiettivo Pr varie nozionie risultati riguardanti lo spazio vettoriale Kr+1 (come quelle di iperpiano, sottospazio, dimensione,operazioni reticolari (∩ e ∨) tra sottospazi, formula di Grassmann, rappresentazioni analitichedi sottospazi e di trasformazioni indotte in Pr da trasformazioni lineari o semilineari di Kr+1, ecc.).Gli iperpiani di Pr sono i luoghi H dei punti P (x) ∈ P che verificano un’equazione lineare del tipo:

H : u0X0 + u1X1 + · · ·+ urXr = 0,

con (u0, . . . , ur) ∈ Kr+1 \0. Il suddetto iperpiano verra denotato con H(u), le (u0 : u1 : · · · : ur) si chiamanole coordinate pluckeriane dell’iperpiano H, e l’equazione di H si scrivera anche in forma compattainterpretando u e x come vettori colonna ed eseguendo il prodotto righe per colonne (e denotando al solitocon tM la trasposta di una matrice M):

H : tuX = 0.

Piu in generale un sottospazio di Pr e un’intersezione di iperpiani, ossia un luogo S dei puntiP (x) ∈ P che verificano un sistema di s ≥ 1 equazioni del tipo:

S : u10X0 + u11X1 + · · ·+ u1rXr = 0, . . . , us0X0 + us1X1 + · · ·+ usrXr = 0. (5)

Alternativamente, i sottospazi - anziche come intersezioni di iperpiani - si possono definire come generatida punti, ossia come i sottoinsiemi S ⊆ P dei punti P (x) del tipo

S =< P (x0), . . . , P (xk) >:= {P (x) ∈ P : x = λ0x0 + λ1x1 + · · ·+ λkxk},

dove k ≥ 0 e un intero, P (x0), . . . , P (xk) sono k + 1 punti e la (k + 1)-pla (λ0, λ1, . . . , λk) varia in Kk+1con la condizione che sia λ0x0 + λ1x1 + · · ·+ λkxk 6= 0, cioe in modo tale che P (x) sia un punto di Pr. Unsottospazio di Pr si dice avere dimensione d, se e generabile da d + 1 punti linearmente indipendentiP (x0), . . . , P (xd), ovvero, in modo equivalente, se esso e l’intersezione di r−d iperpiani linearmente indipen-denti H(u0), . . . ,H(ur−d−1). In quanto precede, l’indipendenza lineare e ben definita da quella dei vettorix0, . . . ,xd e dei vettori u0, . . . ,ur−d−1 rispettivamente. Un sottospazio di dimensione d di Pr si denotageneralmente con Sd; in particolare S−1 denota il sottospazio vuoto, S0 denota un punto, S1 una retta,S2 un piano, . . . , Sr−1 un iperpiano di Pr, ed Sr denota l’intero spazio Pr .

55

Nota bene. Come si e detto, negli spazi proiettivi vale la formula di Grassmann. Da questa si deduconotutte le proprieta grafiche (cioe di appartenenza) di Pr. In particolare, si dimostrano le seguenti proprieta.

(a) Il sottospazio congiungente Sd ∨ S0 ha dimensione d + 1 se S0 /∈ Sd.(b) Il sottospazio intersezione Sd ∩ Sr−1 ha dimensione d− 1 se l’iperpiano Sr−1 non contiene l’Sd.

Esercizio:(1) Considerate in Pr due rette sghembe ed un punto fuori di esse, esiste una e una sola retta passante

per il punto ed appoggiata alle due rette.(1’) Dualizzare la (1).(2) Sia X un qualunque insieme di sottospazi h-dimensionali di Pr, i quali a due a due si intersechino in

uno spazio (h− 1)-dimensionale. Allora, i sottospazi dell’insieme X o passano tutti per un medesimo spazio(h − 1)-dimensionale, oppure sono tutti contenuti in un medesimo spazio (h + 1)-dimensionale. (Questaaffermazione si dimostra facilmente quando h = 1 ed il ragionamento utilizzato si estende facilmente).

(2’) Dualizzare la (2).

L’immersione dello spazio affine nello spazio proiettivo, Ar(K) ↪→ Pr(K), si realizza assumendo

(y1, . . . , yr) 7→ P (1, y1, . . . , yr).

In altri termini, i punti di Ar corrispondono a quelli di Pr non appartenenti all’iperpiano di equazione X0 = 0(detto iperpiano improprio o iperpiano all’infinito di Ar). Le equazioni del passaggio dalle c.p.o allec.a. sono

Y1 = X1/X0, Y2 = X2/X0, . . . , Yr = Xr/X0. (6)

L’iperpiano improprio di Ar e uno spazio proiettivo Pr−1 con le c.p.o. (interne) (X1 : · · · : Xr). Leequazioni del sottospazio all’infinito (o improprio) ∞(A) del sottospazio A dato dalle (4) si ottengono omo-geneizzando le (4) tramite le (6) e facendo quindi sistema con l’ equazione X0 = 0. Si ottiene dunque(sull’iperpiano X0 = 0, cioe in coordinate interne):

∞(A) : u11X1 + · · ·+ u1rXr = 0, . . . , us1X1 + · · ·+ usrXr = 0.

Le equazioni di ∞(A) in Pr si ottengono aggregando l’equazione X0 = 0 alle equazioni precedenti.

Un’ipersuperficie di Pr e una coppia V(f) = (K?f, V (f)), dove f = f(X) ∈ K[X] = K[X0, . . . , Xr] eun polinomio omogeneo e dove V (f), detto il sostegno dell’ipersuperficie, e l’insieme dei punti di Pr cheannullano f :

V (f) := {[(x0, . . . , xr)] ∈ P : f(x0, . . . , xr) = 0}.

Si dice che V(f) e l’ipersuperficie definita in Pr dal polinomio f (o dall’equazionef = 0). Il grado di f sichiama grado o ordine dell’ipersuperficie V(f).

Il seguente teorema caratterizza le ipersuperfici di una retta affine o proiettiva.

Teorema 30 Le ipersuperfici di una retta affine o proiettiva sono i gruppi finiti di punti; piu precisamente,se il campo e algebricamente chiuso, una ipersuperfice di ordine n della retta e un gruppo di n punti, a pattodi contare ogni punto con la dovuta molteplicitta.

56

Dimostrazione. Sia K un campo algebricamente chiuso. Siano A1 la retta affine e P1 la retta proiettivasu K. Introduciamo un riferimento proiettivo A0A1U su P1, e consideriamo su A1 il riferimento affineassociato A0U . Denotiamo con x la coordinata affine e con (x0, x1) le coordinate proiettive omogenee dipunto. Poiche lo spazio ambiente ha dimensione r = 1, i sottospazi di dimensione r − 1 sono quelli didimensione zero, ossia gli iperpiani della retta sono tutti e soli i suoi punti. Di fatto un punto P (α) ∈A1 e l’iperpiano di equazione X − α = 0; inoltre un gruppo finito di n punti {P (α1), P (α2), . . . , P (αn)}di A1 e un’ipersuperficie d’ordine n di equazione (X −α1)(X −α2) · · · (X −αn) = 0. Analogamente unpunto P (a0, a1) ∈ P1 e l’iperpiano di equazione a1X0 − a0X1 = 0.

Inversamente, un’ipersuperficie algebrica di ordine n ≥ 1 della retta affine A1, che dunque sirappresenta con un’equazione del tipo anXn + · · ·+ a1X1 + a0 = 0 a coefficienti in K con an 6= 0, consistedi un gruppo di n punti perche n sono le radici dell’equazione dal momento che K e algebricamentechiuso. Si noti che quelle n radici (e quindi anche i corrispondenti punti) non sono necessariamente tuttedistinte tra loro, ma sono da contarsi ciascuna con la dovuta molteplicita.

Mostriamo che analogamente un’ipersuperficie algebrica di ordine n ≥ 1 della retta proiettivaP1 consiste di un gruppo di n punti (da contarsi con la dovuta molteplicita. Nel caso proiettivo,l’ipersuperficie si rappresenta con un’equazione omogenea del tipo

anXn1 + an−1X

n−11 X0 + · · ·+ a1X1X

n−10 + a0X

n0 = 0 (7)

a coefficienti in K non tutti nulli. Se d e la minima potenza con cui compare la X0 (dove 0 ≤ d ≤ n)l’equazione si scrive (ordinando secondo le potenze decrescenti di X1):

an−dXn−d1 Xd

0 + an−d−1Xn−d−11 Xd+1

0 + · · ·+ a1X1Xn−10 + a0X

n0 =

= Xd0 · (an−dX

n−d1 + an−d−1X

n−d−11 X0 + · · ·+ a1X1X

n−d−10 + a0X

n−d0 ) = 0,

dove an−d 6= 0; si noti che questa equazione si scrive formalmente come nella (7) se d = 0. Le coppieomogenee (x0, x1) che sono radici di questa equazione sono quelle che annullano almeno uno dei due fattoria primo membro; il primo fattore (Xd

0 ) e annullato dalla coppia omogenea (0, 1) che corrisponde al puntoA1 ed e da contarsi con molteplicita d, mentre il secondo fattore non si annulla per X0 = 0 e quindi lesue soluzioni sono le coppie omogene (x0, x1) che corrispondono alle soluzioni x = x1/x0 del polinomio nonomogeneo

an−dXn−d + an−d−1X

n−d−1 + · · ·+ a1X + a0

dove an−d 6= 0, che sappiamo ammettere n − d soluzioni (a patto di contarle con la dovuta molteplicita).Questo completa la dimostrazione. �

Si ha dunque che:

Teorema 31 Un’ipersuperfice della retta affine o proiettiva su un campo K algebricamente chiuso e nonvuota e non invade tutto la retta.

Dimostrazione. Un’ipersuperficie di ordine n ≥ 1 della retta e non vuota perche consiste di un numerofinito n 6= 0 di punti, e non invade tutta la retta perche la retta contiene infiniti punti in quanto il campo Ke infinito essendo algebricamente chiuso (cfr. 5.2.14). �

Piu generalmente si ha il seguente teorema:

57

Teorema 32 Un’ipersuperficie algebrica di uno spazio affine o proiettivo su un campo K algebricamentechiuso e non vuota e non invade tutto lo spazio

Dimostrazione. Supponiamo che lo spazio sia proiettivo (in modo analogo si tratta il caso affine).Sia dunque V (f) (il sostegno di) un’ipersuperficie d’ordine n ≥ 1 dello spazio proiettivo di dimensioner ≥ 1, definita da un polinomio omogeneo f(X0, . . . , Xr) con coefficienti nel campo K non tutti nulli.Dobbiamo dimostrare che il polinomio f(X0, . . . , Xr) ammette in K uno zero (z0, . . . , zr) ed un non-zero(y0, . . . , yr). Dimostriamolo per induzione sulla dimensione r dello spazio. Per r = 1 l’asserto e stato ottenutoesplicitamente nel Teorema 31. Supponiamo allora r ≥ 2 e supponiamo di aver dimostrato l’asserto peripersuperfici di spazi di dimensione minore di r. Scriviamo il polinomio omogeneo f(X0, . . . , Xr) ordinandonei monomi secondo le potenze decrescenti della Xr:

f(X0, . . . , Xr) = Xnr φ0 + · · ·+ Xn−h

r φh(X0, . . . , Xr−1) + · · ·+ Xrφn−1(X0, . . . , Xr−1) + φn(X0, . . . , Xr−1)

dove φh(X0, . . . , Xr−1) e un polinomio omogeneo di grado h nelle r − 1 indeterminate X0, . . . , Xr−1, perh = 0, 1, . . . , n. Poiche i coefficienti di f(X0, . . . , Xr) non sono tutti nulli, esiste una φh(X0, . . . , Xr−1) concoefficienti non tutti nulli, per qualche h = 0, 1, . . . , n. Per ipotesi induttiva esiste un non-zero (y0, . . . , yr−1)

di φh(X0, . . . , Xr−1). Pertanto il polinomio f(y0, . . . , yr−1, Xr) = Xnr φ0 + · · ·+Xn−h

r φh(y0, . . . , yr−1)+ · · ·+Xrφn−1(y0, . . . , yr−1) + φn(y0, . . . , yr−1) e un polinomio di grado positivo nella sola indeterminata Xr. Perla base induttiva questo polinomio ammette uno zero zr ed un non-zero yr. Pertanto (y0, . . . , yr−1, zr) e unozero mentre (y0, . . . , yr−1, yr) e un non-zero di f(X0, . . . , Xr−1, Xr). �

Una varieta algebrica di Pr si definisce come intersezione di ipersuperfici algebriche. In altri termini, perdare una varieta algebrica dobbiamo assegnare un insieme F di polinomi omogenei (non necessariamentedi un medesimo grado) nelle coordinate correnti dello spazio, e si definisce poi, come varieta definita daF , la coppia

V(F ) = (K?F, V (F )), dove V (F ) =⋂

f∈F

V (f),

l’intersezione essendo estesa a tutti i polinomi f di F .Un insieme di punti di Pr che sia sostegno di una varieta algebrica V(F ) si chiama anche un insieme

algebrico proiettivo di Pr. Come nel caso affine, anche la totalita degli insiemi algebrici proiettivi di Pr

e chiusa rispetto all’intersezione ed all’unione, e cio permette di definire l’intersezione e l’unione di varietaalgebriche. Infatti, considerati due insiemi (finiti) F e G di polinomi di K[X], si ha:

V (F ) ∩ V (G) = V (F ∪G) e V (F ) ∪ V (G) = V (FG), dove FG = {fg : f ∈ F, g ∈ G}.

Si noti che l’inclusione V (F ) ∪ V (G) ⊆ V (FG) e banale; viceversa, se P e un punto di V (FG), cioe cheannulla tutti i prodotti fg, e se P non appartiene a V (F ), cioe se P non annulla tutte le f , posto ad esempiof ′(P ) 6= 0, allora, poiche P annulla in particolare tutti i prodotti f ′g, si ha che P annulla tutte le g, cioe Pappartiene a V (G).

Si noti ancora che ogni iperpiano di Pr e un’ipersuperficie di Pr e che, piu generalmente, ogni sottospaziodi Pr e (sostegno di) una varieta algebrica di Pr.

E’ opportuno distinguere tra una varieta V(F ) e il suo sostegno V (F ), in quanto la considerazione di Fpermette di introdurre la nozione (algebrica) di molteplicita delle ”componenti” di V (F ).

Un insieme algebrico proiettivo V (F ) di Pr si dice riducibile o irriducibile a seconda che esistano o nodue insiemi algebrici proiettivi V (F1) e V (F2) contenuti propriamente in V (F ) tali che V (F ) = V (F1)∪V (F2).

Si puo dimostrare che ogni insieme algebrico proiettivo V (F ) puo scriversi in modo unico (a menodell’ordine) come unione di un numero finito di insiemi algebrici proiettivi irriducibili, V (Fi), detti le suecomponenti irriducibili:

V (F ) = V (F1) ∪ V (F2) ∪ · · · ∪ V (Ft).

58

Come nel caso affine, anche attualmente, se V(F ) = (FK?, V (F )) e una varieta algebrica di Pr e se V (Fi) euna componente irriducibile del suo sostegno, la varieta V(Fi) = (FiK

?, V (Fi)) si chiama una componenteirriducibile di V(F ). Si dimostra ancora che rimane definito un intero mi, detto la molteplicita di V (Fi)in V(F ), e che il dato (V (Fi),mi) equivale ad una varieta algebrica V (Gj), che verra denotata anche conmiV (Fi); e scriveremo allora:

V(F ) = m1V (F1) ∪m2V (F2) ∪ · · · ∪mtV (Ft).

In conclusione, ogni varieta algebrica di Pr determina, in modo essenzialmente unico, le sue componentiirriducibili, con le relative molteplicita.

Dimensione di una varieta algebrica. Ordine di una varieta algebrica pura. Vogliamo intro-durre le nozioni di dimensione e di ordine di una varieta algebrica di uno spazio proiettivo Pr su uncampo K algebricamente chiuso.

Consideriamo anzitutto il caso di una ipersuperficie. Sia dunque V = (fK?, V (f)) un’ipersuperficie al-gebrica di Pr, definita dal polinomio omogeneo f = f(X) ∈ K[X] = K[X0, . . . , Xr], di grado n ≥ 1. Si puodimostrare che V (f) e non vuota (perche il campo K e algebricamente chiuso) e non invade tutto lo spazio(perche il campo K e infinito), cfr. Teorema 32.

Dunque esistono punti S0 di Pr non appartenenti a V (f), ossia ”sghembi con V (f)”; d’altra parte si puodimostrare che ogni retta S1 di Pr interseca V (f) in qualche punto (perche K e algebricamente chiuso).Diremo allora che V (f) ha dimensione r− 1. Questa definizione e anche in accordo al fatto che, mentre unpunto P (x) dello spazio Pr dipende da r parametri essenziali, un punto di V (f) dipende da r− 1 parametriessenziali perche f(x) = 0.

Piu precisamente si puo dimostrare che la generica retta S1 di Pr (attualmente ogni retta che non siacontenuta in V (f) ) interseca V (f) in un numero finito di punti, numero che uguaglia il grado n di f(X), apatto di contare ogni punto con un’opportuna molteplicita d’intesezione. Si dice allora che V(f) ha gradoo ordine n. In altri termini il significato geometrico dell’ordine di un’ipersuperficie e che l’ordineuguaglia il numero dei punti che l’ipersuperficie ha in comune con la retta generica dello spazio.

Per convincersi di quanto detto dianzi, si considerino due punti distinti P (y) e P (z) della retta S1. Ipunti di S1 si ottengono tutti come i punti P (x) per i quali x = λy + µz, al variare di (λ, µ) ∈ K2 \ {0, 0)}.I punti comuni ad S1 ed a V(f) si ottengono tutti come i punti P (x) con x = λy + µz per i quali (λ, µ) esoluzione dell’equazione f(λy+ µz) = 0; questa equazione - se non svanisce (cioe se la retta non e contenutanell’ipersuperficie) - e omogenea di grado n in (λ, µ) e dunque da luogo ad esattamente n soluzioni omogenee(λ, µ), a patto di contare ogni soluzione con la sua molteplicita algebrica, cfr. il Teorema 30. Si noti chequesta argomentazione combina il Teorema 30 con quanto espresso dal successivo Teorema della sezione trauna ipersuperficie ed un sottospazio Sd di Pr (cfr. Teorema 39), nel quale si assuma d = 1.

Piu generalmente, sia V(F ) una varieta algebrica di Pr, con K algebricamente chiuso. Diremo che V(F )ha dimensione d, se esistono sottospazi Sr−d−1 sghembi con V (F ), mentre ogni sottospazio Sr−d ha in-tersezione non vuota con V (F ). Qui d = 0, 1 . . . , r − 1. Per estensione, il sottospazio vuoto S−1 e tutto lospazio ambiente Sr vengono considerati varieta algebriche di dimensione −1 ed r rispettivamente. Si notiche il concetto di dimensione di V(F ) fa intervenire soltanto il suo sostegno V (F ).

La dimensione di una varieta algebrica riducibile uguaglia evidentemente la dimensione massima dellesue componenti.

Una varieta algebrica si dice pura se tutte le sue componenti hanno una medesima dimensione. Sia V(F )una varieta algebrica pura di dimensione d. Si dimostra che il generico sottospazio Sr−d interseca V (F ) inun numero finito di punti, che e sempre lo stesso (cioe non dipende dal particolare Sr−d considerato, purchegenerico), a patto di contare ogni punto di V(F )∩Sr−d con la dovuta molteplicita d’intersezione (in un sensoche si puo precisare algebricamente). Tale numero (che dipende non soltanto da V (F ) ma anche da V(F )perche dipende da F (X)) si chiama l’ordine della varieta algebrica pura V(F ). Si dimostra che l’ordine diuna varieta pura uguaglia la somma degli ordini delle sue componenti.

59

Una varieta algebrica (pura) di dimensione d e di ordine n si denota con Vnd . Si dimostra che le Vn

r−1 diPr sono tutte e sole le ipersuperfici di ordine n di Pr e che le Vn

0 sono tutti e soli i gruppi di n punti. Traquesti due estremi (d = 0, d = r − 1) si hanno le Vn

d con d = 1 (che si chiamano curve algebriche d’ordinen), e quelle con d = 2 (che si chiamano superfici algebriche d’ordine n); si hanno poi tutte le possibili Vn

d ,con 2 < d < r − 1. Inoltre si dimostra che le V1

d sono tutti e soli i sottospazi Sd.

Teorema 33 (Teorema di Bezout negli iperspazi). Sia Pr lo spazio proiettivo r-dimensionale su uncampo K algebricamente chiuso. Allora: r ipersuperfici algebriche di Pr di ordini n1, n2, . . . , nr, che nonabbiano infiniti punti in comune, hanno esattamente n1n2 · · ·nr punti in comune, a patto di contare ognipunto d’intersezione con la ”dovuta” molteplicita d’intersezione. Il numero dei punti distinti e effettivamenten1n2 · · ·nr se le ipersuperfici sono generiche. �

Corollario 34 L’intersezione di k ipersuperfici algebriche generiche di Pr di gradi n1, n2, . . . ,nk e unavarieta algebrica pura di dimensione r − k e di ordine n1n2 · · ·nk.

Dimostrazione. Si applichi il Teorema di Bezout alle r ipersuperfici date dalle k considerate nel corollarioe da r − k iperpiani generici dello spazio. �

Deduzione del teorema di Bezout dal principio di conservazione del numero di intersezioni.Nel caso in cui K = C, il suddetto Teorema 33 (di Bezout) segue dal principio di conservazione delnumero di intersezioni per variazioni continue generiche. Le r ipersuperfici f1, f2, . . . , fr si fanno de-generare, per variazione continua generica, in r ipersuperfici g1, g2, . . . , gr spezzate in n1, in n2, . . . , in nr

iperpiani rispettivamente. Allora g1 ∩ · · · ∩ gr consiste di n1n2 · · ·nr punti, perche, per ogni scelta di uniperpiano in ciascuna ipersuperfice gi (i = 1, 2, . . . , r), si ottengono r iperpiani indipendenti (perche generici)e che dunque hanno come intersezione un punto. I punti di f1 ∩ · · · ∩ fr sono altrettanti. Cio da anche unsignificato dinamico alla molteplicita d’intersezione delle ipersuperfici f1, f2, . . . , fr in un loro punto comune.

6.4 Sistemi lineri e sistemi algebrici di ipersuperfici di Pr(K).

Lemma 35 Il numero delle combinazioni con ripetizione di n oggetti di classe k e(n+k−1

k

).

Dimostrazione. Sia X = {1, . . . n} l’insieme degli n oggetti. Sia Y = {1, . . . , n + k − 1}. Per dimostrareil lemma basta evidentemente stabilire una bijezione f tra l’insieme delle combinazioni con ripetizione diclasse k di elementi di X e l’insieme

(Yk

)dei k-sottoinsiemi di Y . Sia A una combinazione con ripetizione di

classe k di elementi di X. Ordiniamo gli elementi di A in ordine non decrescente:

A = (a1, . . . , ak) con 1 ≤ a1 ≤ a2 ≤ · · · ≤ ak ≤ n.

Associamo ad A il k-sottoinsieme

f(A) = {a1, a2 + 1, . . . , ak + k − 1} ∈(

Y

k

);

si noti che1 ≤ a1 < a2 + 1 · · · < ak + k − 1 ≤ n + k − 1.

Ogni B ∈(Yk

)e del tipo B = f(A) per esattamente una combinazione con ripetizione A di classe k degli n

oggetti di X: infatti, possiamo ordinare gli elementi di B in ordine (strettamente) crescente:

B = {b1, . . . , bk} con 1 < b1 < · · · < bk ≤ n + k − 1,

e risalire poi alla combinazione A = (a1, . . . , ak) assumendo a1 := b1, a2 := b2 − 1, . . . , ak := bk − k + 1 comee d’obbligo. �

60

Corollario 36 Il numero dei monomi distinti Xi1Xi2 · · ·Xin di grado n in r+1 indeterminate X0, X1, . . . , Xr

e:

N + 1 =(

r + n

n

). �

Sia ora K un campo algebricamente chiuso. Ogni polinomio f(a;X) ∈ K[X] = K[X0, X1, . . . , Xr], omogeneodi grado n, si scrive nella forma

f(a;X) =∑

(i1,i2,...,in)

ai1i2...inXi1Xi2 · · ·Xin ,

dove la somma e estesa a tutte le combinazioni con ripetizione (i1, i2, . . . , in) di classe n degli r + 1 elementidi {0, 1, . . . , n}. Pertanto f(a;X), qualora se ne scrivano i monomi in un ordine fissato una volta pertutte, determina ed e determinato dalla stringa ordinata a = (ai1i2...in

) dei suoi N + 1 coefficienti. Poichel’ipersuperficie V(f) = (K?f, V (f)) di Pr = Pr(K), d’equazione f(a;X) = 0, determina ed e determinatadai polinomi λf(a;X) = f(λa;X) proporzionali ad f secondo scalari λ non nulli, si ha che l’ipersuperficieV(f) determina ed e determinata dal punto P (a) = P (λa) dello spazio proiettivo numerico N -dimensionalesu K, che denoteremo ora con SN riservando la notazione Pr allo spazio contenente V(f). Conviene inoltredenotare con Pd (risp. con Sd) un sottospazio d-dimensionale di Pr (risp. di SN ).

Questo spazio SN si chiama lo spazio rappresentativo del sistema delle ipersuperfici d’ordinen di Pr. L’applicazione biunivoca Λ dall’insieme delle ipersuperfici d’ordine n di Pr sull’insieme deipunti di SN definita da

Λ : V(f) = V(f(a;X)) 7→ P (a) ∈ SN

si chiama la rappresentazione lineare delle ipersuperfici d’ordine n di Pr coi punti di SN . Per abusodi linguaggio, diremo anche che SN e lo spazio delle ipersuperfici d’ordine n di Pr. Un insieme T diipersuperfici d’ordine n di Pr si chiama un sistema lineare (risp. un sistema algebrico) di ipersuper-fici se la sua immagine Λ(T ) tramite la rappresentazione lineare Λ e un sottospazio (risp. una varietaalgebrica) dello spazio rappresentativo SN .

Tutte le nozioni relative ad Λ(T ) in SN si trasportano o si rileggono in Pr relativamente a T . Ad esempio,due o piu ipersuperfici d’ordine n di Pr si dicono (linearmente) dipendenti o indipendenti se tali sono ipunti che le rappresentano in SN . Ed ancora: se Λ(T ) e un sottospazio Sd di SN , si dice che d e la dimensionedel sistema lineare T ; inoltre, se d = 0 (cioe se Λ(T ) e un punto), T e una singola ipersuperficie d’ordine n diPr, se d = 1 (cioe se Λ(T ) e una retta) si dice che T e un fascio, mentre se d = 2 (cioe se Λ(T ) e un piano) sidice che T e una rete. I sistemi lineari di dimensione > 2 non ricevono nomi particolari, ma fra essi hannoparticolare importanza quelli di dimensione N − 1, cioe quei sistemi lineari T tali che Λ(T ) e un iperpiano diSN . Tutte le ipersuperfici d’ordine n di Pr costituiscono il sistema lineare completo delle ipersuperficid’ordine n di Pr. Evidentemente un insieme T di ipersuperfici d’ordine n di Pr e un sistema lineare se esoltanto se T contiene il fascio generato da due sue qualunque ipersuperfici distinte. Inoltre, se Λ(T ) e unavarieta algebrica V n

d di SN , si dice che d ed n sono la dimensione e l’ordine del sistema algebrico T .Un sistema lineare d-dimensionale T di ipersuperfici d’ordine n di Pr e individuato quando se ne conoscano

d+1 ipersuperfici indipendenti. Se queste hanno equazione rispettivamente f (0) = 0, . . . , f (d) = 0, scriveremoT =< f (0), . . . , f (d) >. Se a(j) e la stringa dei coefficienti di f (j), cioe se f (j) = f(a(j);X), j = 0, . . . , d, leequazioni delle ipersuperfici date si scrivono esplicitamente come

f(a(0);X) = 0, f(a(1);X) = 0, . . . , f(a(d);X) = 0,

e le ipersuperfici del sistema T da esse generato sono quelle aventi equazione del tipo

λ0f(a(0);X) + λ1f(a(1);X) + · · ·+ λdf(a(d);X) = 0,

cioe del tipof(a;X) = 0 con a = λ0a(0) + λ1a(1) + · · ·+ λda(d),

61

al variare di (λ0, λ1, . . . , λd) ∈ Kd+1 \ {(0, . . . , 0)}.

La varieta base di un sistema lineare T =< f (0), . . . , f (d) > di ipersuperfici d’ordine n di Pr e la varietaalgebrica V di Pr intersezione di tutte le ipersuperfici di T . Per ottenere V basta evidentemente considerarel’intersezione delle ipersuperfici f (0), . . . , f (d) che generano T , ossia, posto F = {f (0), . . . , f (d)}, si ha:

V = (FK?, V (F )), dove V (F ) ha equazioni : f (0) = 0, . . . , f (d) = 0.

Un punto base di T e per definizione un punto di Pr appartenente alla varieta base di T , ossia un puntocomune a tutte le ipersuperfici del sistema T .

Consideriamo i seguenti esempi di sistemi lineari di ipersuperfici di ordine n di Pr.

Per n = 1, si ha che ogni ipersuperficie V(f) e un iperpiano di Pr e la totalita delle V(f) e il sistemalineare totale degli iperpiani di Pr. Infatti, attualmente a e la stringa u delle coordinate pluckerianedell’iperpiano d’equazione f(u;X) = u0X0 + · · · + urXr = 0; si ha N = r e lo spazio rappresentativo SN

e lo spazio duale di Pr. In questo caso, i sistemi lineari sono i sistemi lineari di iperpiani; ricordiamoche (Teorema della stella di iperpiani) ogni stella d’iperpiani Σ(Sd) di centro un sottospazio didimensione d di Pr e un sistema lineare d’iperpiani di Pr di dimensione r − d − 1, Σr − d − 1,e viceversa41. La varieta base di un sistema lineare d’iperpiani Σd = Σ(Sr−d−1) di Pr e il centro Sr−d−1

della stella.Diamo ora un esempio di sistema algebrico di iperpiani di Pr. La totalita T degli iperpiani tu ·X = 0

tangenti ad una quadrica non singolare di Pr avente equazione tXAX = 0 e un sistema algebrico di dimensioner − 1 e di ordine 2 costituito da ipersuperfici aventi grado n = 1: tale sistema algebrico si rappresenta nellospazio Σr duale di Pr con la quadrica V2

r−1 avente equazione tu ·t A−1 · u = 0.

Per r = 1, lo spazio Pr = P1 e la retta proiettiva; ogni ipersuperficie V(f) d’ordine n di P1 e ungruppo di n punti della retta ed e N = n. In questo caso un sistema lineare di dimensione d si chiamatradizionalmente una serie lineare gn

d di gruppi di n punti (nella scrittura gnd , oltre alla dimensione d si

mette in evidenza il grado n, ma si ricordi che il sistema e lineare ossia, come sistema algebrico, ha ordine1). In particolare gn

n e la serie lineare completa dei gruppi di n punti della retta.

Per r = 2, lo spazio Pr =P2 e il piano proiettivo; ogni ipersuperficie V(f) d’ordine n di P2 e una curvapiana d’ordine n ed e N = n(n + 3)/2. Cosı la totalita delle coniche e un sistema lineare di dimensione 5,la totalita delle cubiche piane un sistema lineare di dimensione 9, ecc.

Per r = 3, lo spazio Pr e lo spazio proiettivo 3-dimensionale; ogni ipersuperficie V(f) d’ordine n di P3 euna superficie d’ordine n e si trova N = n(n2 + 6n + 11)/6.

Per n = 2 ed r = 1, 2, 3, . . . si ha il sistema lineare completo delle quadriche di Pr che ha dimensioneN = r(r + 3)/2. In particolare, per r = 1 si ritrova la serie completa g2

2 ; per r = 2 si ritrova il sistemacompleto S5 delle coniche; per r = 3 si trova il sistema completo S9 delle quadriche di P3; ecc.

Nota bene. Nel seguito, indicheremo con Pr lo spazio proiettivo di partennza (nel quale cioe siconsiderano le ipersuperfici di fissato ordine n) e con Pk un qualunque sottospazio k-dimensionale di Pr,

41Per la dimostrazione si noti che il sottospazio Sd =< A0, A1, . . . , Ad > (dove Aj = P (δ0j , δ1j , . . . , δrj), j ∈ {0, 1, . . . , d} sonoi d + 1 punti fondamentali di Pr indicati) ha equazioni Xd+1 = Xd+2 = · · · = Xr = 0 e che la totalita Σ(Sd) degli iperpiani checontengono Sd coincide con quella degli iperpiani del sistema lineare di equazione ud+1Xd+1 +ud+2Xd+2 + · · ·+urXr = 0, chee un sistema lineare Σr−d−1 perche generato da r − d iperpiani indipendenti (che sono gli iperpiani fondamentali di equazioneXd+1 = 0, Xd+2 = 0, . . . , Xr = 0 rispettivamente). Ebbene, previo un cambiamento di riferimento nello spazio Pr o nelsuo duale Σr, non e restrittivo supporre che il sottospazio Sd sia quello generato dai punti fondamentali indicati, o, per laparte inversa, che il sistema lineare Σr−d−1 sia quello generato dagli iperpiani fondamentali indicati. Si noti anche che si staapplicando la proprieta che un iperpiano di equazione u0X0 + u1X1 + · · · + urXr = 0 contiene un punto fondamentale As diPr sse us = 0.

62

k = −1, 0, 1, . . . , r. Per abuso di linguaggio, indicheremo poi con lo stesso simbolo SN tanto lo spazio rapp-resentativo delle ipersuperfici d’ordine n di Pr quanto la totalita di quelle ipersuperfici. Conseguentementeindicheremo con lo stesso simbolo Sd tanto un sottospazio d-dimensionale di SN quanto il sistema lineare diipersuperfici che l’Sd rappresenta.

Lemma 37 Sia Sd un sistema lineare di dimensione d di ipersuperfici d’ordine n di Pr. Se P ∈ Pr none un punto base di Sd, le ipersuperfici di Sd che passano per P costituiscono un sistema lineare Sd−1, didimensione d− 1.

Dimostrazione. Sia P = P (z), z = (z0, z1, . . . , zr). Le ipersuperfici d’ordine n di Pr che passano per P (z)sono quelle la cui stringa a dei coefficienti (che sono le c.p.o. di punto in SN ), soddisfano alla f(a; z) = 0.Questa e una condizione lineare per le ai1i2...in , ossia rappresenta un iperpiano SN−1 che denoteremo con Lz

e che in SN ha equazione:

Lz : f(a; z) =∑

(i1,i2,...,in)

ai1i2...inzi1zi2 · · · zin

= 0.

Attualmente Sd non e contenuto nell’iperpiano Lz, perche P (z) non e un punto base di Sd. PertantoSd ∩ Lz = Sd ∩ SN−1 e un sottospazio (d− 1)-dimensionale di SN , �

Nota bene. Riprenderemo in seguito le considerazioni sviluppate nella dimostrazione del Lemma 37,perche esse sono alla base della importante nozione di immagine proiettiva di un sistema lineare diipersuperfici.

Con riferimento all’enunciato del Lemma 37, diremo che il punto P stacca il sistema Sd−1 dal sistemaSd, o che il sistema Sd−1 e quello staccato da P in Sd.

Corollario 38 (Significato geometrico della dimensione di un sistema lineare). Sia Sd un sistemalineare di dimensione d di ipersuperfici d’ ordine n di Pr. Il significato di d e che per d punti generici diPr passa esattamente un’ipersuperficie del sistema Sd.

In particolare: per N punti generici di Pr passa esattamente un’ipersuperficie d’ordine n di Pr.

Dimostrazione. Consideriamo d punti P1, . . . , Pd scelti in modo generico in Pr, e precisamente inmodo tale che nessuno appartenga alla varieta base del sistema lineare delle ipersuperfici di Sd passanti peri punti precedentemente scelti: P1 sia scelto fuori della varieta base del sistema lineare Sd assegnato; P2 siascelto fuori della varieta base del sistema lineare Sd−1 staccato da P1 in Sd; P3 sia scelto fuori della varietabase del sistema lineare Sd−2 staccato da P2 in Sd−1; . . . ;Pd sia scelto fuori della varieta base del sistemalineare S1 staccato da Pd−1 in S2. L’imposizione del passaggio per Pd conduce ad un sistema lineare S0

cioe ad una unica ipersuperficie, che e dunque l’unica ipersuperficie del sistema Sd che passi per i puntiP1, . . . , Pd.

In particolare, applicando questo risultato al sistema lineare completo SN di tutte le ipersuperfici d’ordinen di Pr (ossia per d = N), si ottiene l’ultima affermazione. �

Esercizi. (1) Verificare il contenuto del Corollario nel caso particolare che sia n = 1, cioe illustrando ilsignificato della dimensione di un sistema lineare d’iperpiani di Pr.

(2) Per cinque punti generici di P2 passa una e una sola conica. Qui ”generici” significa che quattroqualunque fra questi punti non sono allineati.

(3) Per cinque punti generici di P2 passa una e una sola conica non singolare. Qui ”generici” significa

63

che tre qualunque fra questi punti non sono allineati.(4) Per nove punti generici di P2 passa una e una sola cubica.(5) Quattro punti generici di P2 sono punti base di un fascio generico di coniche. Viceversa, un fascio

generico di coniche ha come varieta base un gruppo di quattro punti generici del piano.(6) Otto punti generici di P2 sono punti base di un fascio generico di cubiche.(7) (Paradosso di Cramer) Un fascio generico di cubiche di P2 ha come varieta base un gruppo di

nove punti generici del piano. Pertanto, per quei nove punti passano tutte le cubiche del fascio, ma ciocontraddice (4). (Soluzione: Non e vero che un fascio generico di cubiche di P2 ha come varieta base ungruppo di nove punti generici del piano: soltanto un qualunque gruppo di otto fra quei punti consiste dipunti generici, perche il nono punto e determinato da quegli otto come ulteriore punto base del fascio dicubiche passanti per essi).

Teorema 39 (Teorema della sezione per le ipersuperfici) L’intersezione di un’ipersuperficie di Pr conun sottospazio Pk non contenuto nell’ipersuperficie e un’ipersuperficie, dello stesso ordine, del sottospazio Pk.

Dimostrazione. Poiche le nozioni che intervengono nell’enunciato del teorema sono invarianti per cambia-menti di c.p.o. in Pr, non e restrittivo supporre di aver scelto in Pr un riferimento proiettivo in modo taleche il sottospazio Pk sia un sottospazio coordinato, diciamo quello di equazioni:

Pk : Xk+1 = 0, Xk+2 = 0, . . . , Xr = 0;

supponiamo poi che l’ipersuperficie abbia equazione (di grado diciamo n):

V(f) : f(X0, X1, . . . , Xk, Xk+1, . . . , Xr) = 0.

L’intersezione Pk ∩ V(f) si rappresenta in Pr con il sistema:

Pk ∩ V(f) : Xk+1 = 0, Xk+2 = 0, . . . , Xr = 0; f(X0, X1, . . . , Xk, 0, . . . , 0) = 0,

e si rappresenta in Pk (in coordinate interne) con la sola equazione

Pk ∩ V(f) : f(X0, X1, . . . , Xk, 0, . . . , 0) = 0.

Il primo membro di questa e un polinomio - non nullo, perche Pk non e contenuto in V(f) - omogeneo dellostesso grado n nelle coordinate di Pk, e dunque rappresenta un’ipersuperficie d’ordine n di Pk. �

Teorema 40 (Teorema della sezione per i sistemi lineari. L’intersezione di un sistema lineare Sd diipersuperfici d’ordine n di Pr con un sottospazio Pk e un sistema lineare d’ipersuperfici d’ordine n di Pk .Tale sistema lineare ha dimensione d− t, dove t e il massimo numero delle ipersuperfici indipendenti di Sd

che contengono Pk.

Dimostrazione. Poiche le nozioni che intervengono nell’enunciato del teorema sono invarianti per cambia-menti di c.p.o. in Pr, non e restrittivo supporre di aver scelto in Pr un riferimento proiettivo in modo taleche il sottospazio Pk sia un sottospazio coordinato, diciamo quello di equazioni:

64

Pk : Xk+1 = 0, Xk+2 = 0, . . . , Xr = 0.

Il sistema Sd sara generato da d + 1 ipersuperfici (indipendenti) di equazione f (j)(X) = 0, j = 0, . . . , d,dove possiamo supporre che le ultime t fra queste (quelle con j = d−t+1, . . . , d), ma nessuna delle rimanenti,contengano Pk. L’equazione di una qualunque ipersuperfice del sistema Sd e del tipo

V(f) ∈ Sd : λ0f(0)(X) + λ1f

(1)(X) + · · ·+ λdf(d)(X) = 0,

dove (λ0, λ1, . . . , λd) ∈ Kd+1 \ {(0, . . . , 0)}. Al variare delle λ si ottegono tutte e sole le ipersuperfici delsistema Sd.

L’intersezione Pk ∩ V(f) di Pk con ciascuna V(f) ∈ Sd si rappresenta in Pr con il sistema:

Pk ∩ V(f) :d∑

j=0

λjf(j)(X0, . . . , Xk, 0, . . . , 0) = 0, Xk+1 = 0, Xk+2 = 0, . . . , Xr = 0,

e si rappresenta in Pk (in coordinate interne) con la sola equazione

Pk ∩ V(f) :d∑

j=0

λjf(j)(X0, . . . , Xk, 0, . . . , 0) = 0.

Per ciascuna scelta delle λ non tutte nulle, il primo membro e un polinomio - non nullo, perche altrimentisi troverebbe in Sd una V(f), indipendente dalle V(f (d−t+1)), . . . ,V(f (d)) e contenente Pk - omogeneo di gradon nelle coordinate di Pk e che dunque rappresenta un’ipersuperficie d’ordine n di Pk. Al variare delle λ siha dunque un sistema lineare di ipersuperfici d’ordine n di Pk, il quale ha dimensione d−t, perche - per quantodetto poc’anzi - i polinomi f (0)(X0, . . . , Xk, 0, . . . , 0), f (1)(X0, . . . , Xk, 0, . . . , 0), . . . , f (d−t)(X0, . . . , Xk, 0, . . . , 0)sono linearmente indipendenti. �

Esercizio. Rivisitare la dimostrazione del teorema precedente alla luce del teorema fondamentale diomomorfismo tra spazi vettoriali. Suggerimento: si consideri l’omomorfismo

K[X0, X1, . . . , Xr] → K[X0, X1, . . . , Xk, 0, . . . , 0] : f(X0, X1, . . . , Xr) 7→ f(X0, X1, . . . , Xk, 0, . . . , 0).

7 Naturalezza degli spazi di dimensione superiore

Abbiamo ora gli elementi per illustrare come sia del tutto naturale considerare spazi di dimensione superiore.Vedremo infatti (n. 7.1) che quando si studia la totalita delle rette di un P3(K), di fatto si sta studiandouna ipersuperficie quadrica V 2

4 di uno spazio P5(K) (la quadrica di Klein). Inoltre, sappiamo gia che leconiche di P2(K) costituiscono uno spazio P5(K); dunque studiando la totalita delle coniche ci si muove -volenti o nolenti - in P5(K). Vedremo poi (n. 7.2) che lo studio delle coniche singolari equivale allo studio diuna ipersuperficie algebrica V 3

4 di P5(K), e che la totalita delle coniche doppiamente singolari corrispondead una superficie V 4

2 (la superficie di Veronese) contenuta nella V 34 . Vedremo anche come la superficie

di Veronese V 42 (legata alle coniche) sia un caso particolare della superficie di Veronese V n2

2 (legata allecurve piane di ordine n qualunque) e, ancor piu generalmente, della varieta di Veronese V nr

r (legata alleipersuperfici d’ordine n di un Pr(K)).

65

7.1 La geometria della retta di P3(K) e la quadrica di Klein V 24

Consideriamo lo spazio P3 = P3(K). Sappiamo che ogni punto di P3 ha le sue c.p.o. di punto, (x0, x1, x2, x3),e che ogni piano di P3 ha le sue coordinate plukeriane d’iperpiano, (u0, u1, u2, u3). Vogliamo ora attribuirecoordinate proiettive anche a ciascura retta di P3.

Denotiamo con G(1, 3) l’insieme delle rette di P3. Consideriamo una retta qualunque S1 ∈ G(1, 3),individuata da due suoi punti distinti qualunque P (x) e P (y). La matrice delle c.p.o. dei due punti:

(x0 x1 x2 x3

y0 y1 y2 y3

)

ha rango 2 perche i due punti sono distinti. Pertanto, in tale matrice, sono non tutti nulli i seguenti minoridel second’ordine:

p01 = x0y1 − y0x1, p02 = x0y2 − y0x2, p03 = x0y3 − y0x3,

p23 = x2y3 − y2x3, p31 = x3y1 − y3x1, p12 = x1y2 − y1x2.

La suddetta sestupla p=p(x,y)=(p01, p02, p03, p23, p31, p12) ∈ K6 \ 0 determina un punto P (p) dellospazio P5(K). Verificheremo ora che questo punto P (p) dipende soltanto dalla retta S1 e non dipendene dalla scelta dei punti P (x) e P (y) su S1 ne dai loro rispettivi rappresentanti x e y; ne seguira chele (p01, p02, p03, p23, p31, p12) si possono assumere come coordinate proiettive della retta S1, che vengonochiamate le coordinate pluckeriane (o grassmanniane) della retta. Per la verifica anzidetta, bastaosservare che se λ, µ ∈ K \ {0} e se P (z) e un qualunque altro punto di S1 con z = λx + µy, si ha:

p(λx, µy) = λµp(x,y),

p(z,y)=p(λx + µy,y) = λp(x,y) + µp(y,y) = λp(x,y) + 0 = λp(x,y),

p(x,z)=p(x,λx+µy) =λp(x,x)+µp(x,y) = 0 + µp(x,y) = µp(x,y).

Possiamo dunque dire che abbiamo definito un’applicazione dall’insieme G(1, r) delle rette di P3(K)all’insieme dei punti di P5(K):

G(1, r) → P5(K) : S1(p) 7→ P (p),

che chiameremo mappa di Klein: ad una qualunque retta S1 di P3(K), avente coordinate plukeriane dateda p = (p01, p02, p03, p23, p31, p12), resta associato il punto P (p) di P5(K); questo punto non e un puntoqualunque di P5(K), ma e obbligato ad appartenere alla quadrica V 2

4 di P5(K), chiamata la quadrica diKlein, di equazione:

V 24 : f(p) = p01p23 + p02p31 + p03p12 = 0,

come si ha subito sviluppando il determinante nullo della matrice

x0 x1 x2 x3

y0 y1 y2 y3

x0 x1 x2 x3

y0 y1 y2 y3

66

secondo i minori del secondo ordine delle prime due righe42

La mappa di Klein e surgettiva sulla quadrica di Klein, cioe ogni punto P (p) ∈ V 24 e immagine di

una retta S1 = S1(p) di P3(K). Sia dunque p = (p01, p02, p03, p23, p31, p12) ∈ K6 \ {0} tale che f(p) = 0.Per fissare le idee, sia ad es. p01 6= 0. Consideriamo in P3(K) i due punti distinti P (x’) e P (y’), conx’ = (0, p01, p02, p03) e y’ = (−p01, 0, p12,−p31). Verifichiamo che la retta S1 per i due punti P (x’) eP (y’) ha coordinate p(x’,y’) uguali o proporzionali alla sestupla (p01, p02, p03, p23, p31, p12). Calcoliamop(x’,y’) := (p′01, p

′02, p

′03, p

′23, p

′31, p

′12) tramite la matrice delle c.p.o. di x’ e di y’:

(0 p01 p02 p03

−p01 0 p12 −p31

)

Si trova: p′01 = p01p01, p′02 = p01p02, p

′03 = p01p03, p

′31 = p01p31, p

′12 = p01p12, e finalmente p′23 = −p02p31 −

p12p03 = p01p23 in forza della f(p) = 0. In conclusione p(x’,y’) = p01(p01, p02, p03, p23, p31, p12), comeasserito.

Mostriamo ora che la mappa di Klein e iniettiva. Siano S1 = XY ed S′1 = X ′Y ′ due rette di P3(K)

(individuate dai punti indicati: X = P (x), ecc. ) aventi le loro coordinate plukeriane di retta proporzionali,anzi uguali (come e sempre possibile supporre disponendo del fattore di proporzionalita insito nelle c.p.o.del punto X): p = p′ = (p01, p02, p03, p23, p31, p12), dove sia ad es. p01 6= 0. Dobbiamo dimostrare cheS1 = S′

1.

Nota bene. Per semplicita di scrittura, conviene effettuare il seguente abuso di notazione: denotiamocon lo stesso simbolo X sia il punto P (x) sia il vettore x ∈ K4 che lo rappresenta, e similmente per gli altripunti Y, X ′, Y ′ ecc. In particolare, se λ.µ ∈ K, la scrittura λX + µY indica il punto P (λx + µy).

Mostriamo anzitutto che e possibile sostituire i punti X ′ ed Y ′ di S′1 con altri due punti X? = aX ′+bY ′ e

Y ? = cX ′+dY ′ (dunque anche essi appartenenti ad S′1 !) in modo che sia x?

0 = x0, x?1 = x1 e y?

0 = y0, y?1 = y1.

Basta infatti risolvere in (a, b) ed in (c, d) rispettivamente i sistemi di Cramer:

x0 = ax′0 + by′0, x1 = ax′1 + by′1 e y0 = cx′0 + dy′0, y1 = cx′1 + dy′1.

Con questa scelta dei punti, la matrice corrispondente alla retta S1 = XY e:(x0 x1 x2 x3

y0 y1 y2 y3

)e la matrice corrispondente alla retta S′

1 = X?Y ? e(x0 x1 x?

2 x?3

y0 y1 y?2 y?

3

).

Queste matrici hanno uguali le prime due colonne; ma anche le ultime due colonne sono uguali: infatti(x2, y2) = (x?

2, y?2) e l’unica soluzione del sistema di Cramer nelle incognite (X2, Y2):

p02 = x0Y2 − y0X2, p12 = x1Y2 − y1X2,

e (x3, y3) = (x?3, y

?3) e l’unica soluzione del sistema di Cramer nelle incognite (X3, Y3):

p03 = x0Y3 − y0X3, p31 = X3y1 − Y3x1.

42Si noti che tale sviluppo conduce alla 2f(p) = 0, da cui si deduce subito f(p) = 0 se il campo K ha caratteristica 6= 2.D’altra parte poiche la f(p) = 0 vale dunque in caratteristica zero, essa appare come una identita nelle indeterminate xi e yj ,e pertanto vale anche in caratteristica 2.

67

Pertanto x = x?,y = y? e quindi X = X?, Y = Y ?, e cosı S1 = XY = X?Y ? = S′1.

In conclusione: la mappa di Klein e biunivoca tra l’insieme delle rette di P3(K) e l’insieme deipunti della quadrica di Klein V 2

4 . Dunque l’insieme delle rette di P3(K) ”e” - in senso astratto - unaquadrica dello spazio P5(K) (la quadrica di Klein).

Vediamo ora come la ”geometria della retta ” in P3(K) si rifletta nella geometria della quadrica di Klein.Consideriamo, oltre alla forma quadratica che definisce la quadrica di Klein:

f(p) = p01p23 + p02p31 + p03p12 = 0,

anche la forma bilineare associata

f(p,q) = p01q23 + p02q31 + p03q12 + q01p23 + q02p31 + q03p12.

Lemma 41 (Condizione d’incidenza). Due rette di P3(K), aventi rispettivamente coordinate plukerianep e q, sono incidenti sse f(p,q) = 0.

Dimostrazione. Siano XY e ZT due rette di P3(K). Sia X = X(x), . . . , T = T (t), con p = p(x,y) =(p01, p02, p03, p23, p31, p12) e q = q(z,t) = (q01, q02, q03, q23, q31, q12). Le due rette sono incidenti sse i puntiX, Y, Z, T appartengono ad un piano, cioe sse i vettori x,y, z, t sono dipendenti, cioe sse la matrice

x0 x1 x2 x3

y0 y1 y2 y3

z0 z1 z2 z3

t0 t1 t2 t3

ha determinante nullo. Tale determinante e proprio f(p,q), come si vede calcolandolo secondo i minori delsecondo ordine delle prime due righe. �

Teorema 42 La mappa di Klein trasforma le rette di ciascun fascio di P3(K) nei punti di una retta giacentesulla quadrica di Klein. Viceversa, ogni retta giacente sulla quadrica di Klein e immagine di un fascio dirette di P3(K).

Dimostrazione. Sia S2 un piano di P3(K) e sia F un fascio di rette di S2 con centro in un punto X(x).Siano S′

1 ed S′′1 due rette distinte del fascio F , e siano Y ′(y′) ed Y ”(y′′) due loro rispettivi punti distinti da

X. Tutte e sole le rette di F sono le rette XY con Y (y) ∈ Y ′Y ”. (Il Lettore faccia un disegno.) Posto chesia y = ay′ + by′′, le coordinate plukeriane pik di XY si esprimono tramite le p′ik di XY ′ e le p′′ik di XY ′′

con la stessa coppia (a, b) di parametri, ossia nel modo seguente:

pik = ap′ik + bp′′ik vale a dire p = ap′ + bp′′

Infatti:

pik =

xi xk

yi yk

=

xi xk

ay′i + by′′i ay′k + by′′k

= a

xi xk

y′i y′k

+ b

xi xk

y′′i y′′k

= ap′ik + bp”ik

68

ossia:p = p(x,y) = p(x, ay′ + by′′) = ap(x,y′) + bp(x,y′′) = ap′ + bp′′

e cio dimostra la prima affermazione. Tornera utile la seguente

Osservazione. Al variare dei parametri (a, b) si trovano tutti i punti Y = aY ′ + bY ′′ della retta Y ′Y ′′

di S2 e tutte le rette XY = S1(p = ap′ + bp′′) del fascio di centro X di S2 generato dalle rette XY ′(p′) eXY ′′(p′′), ovverosia tutti i punti della retta di P5(K) passante per i punti P (p′) e P (p′′).

Mostriamo ora che, viceversa, ogni retta di P5(K) giacente sulla quadrica di Klein e immagine diun fascio di rette di P5(K). Si consideri dunque sulla quadrica di Klein V 2

4 una qualunque retta T1 e duepunti distinti P (p′) e P (p′′) di T1. Per la biunivocita della mappa di Klein, questi due punti sono immaginidi due rette S′

1(p′) e S′′

1 (p′′) di P3(K) le quali sono incidenti (e dunque individuano un fascio F di rette), invirtu del Lemma 41, perche f(p′,p′′) = 0 in quanto:

(∀a, b ∈ K \ {0}) P(ap′ + bp′′) ∈ T1 ⊆ V 24 =⇒

(∀a, b ∈ K\{0}) 0 = f(ap′+bp′′) = a2f(p′)+b2f(p′′)+abf(p′,p′′) = 0+0+abf(p′,p′′) =⇒ f(p′,p′′) = 0.

Per quanto osservato, i punti P (p) = P (ap′ + bp′′) della retta T1 corrispondono biunivocamente allerette S1(p) =S1(p = ap′ + bp′′) del fascio F individuato dalle due rette incidenti S′

1(p′) e S′′

1 (p′′) , e questodimostra che il fascio F e la controimmagine completa della retta T1. �

Dimostriamo ora che:

Teorema 43 (1) La mappa di Klein trasforma ciascuna stella di rette di P3(K) in un piano giacente sullaquadrica di Klein (piano di tipo σ).(2) La mappa di Klein trasforma ciascun piano rigato di P3(K) in un piano giacente sulla quadrica di Klein(piano di tipo ρ).(3) Viceversa, ogni piano giacente sulla quadrica di Klein e immagine completa di una stella di rette oppuredi un piano rigato di P3(K), ossia e un piano di tipo σ oppure un piano di tipo ρ.

Dimostrazione. (1) Sia Σ una stella di rette di P3(K). Sia X(x) il centro di Σ, siano S′1, S

′′1 , S′′′

1

tre rette non complarari di Σ, sia S2 un piano non contenente X, e siano Y ′(y′), Y ′′(y′′), Y ′′′((y′′′) i punti(necessariamente non allineati) in cui quelle tre rette rispettivamente incontrano S2. Tutte e sole le rette diΣ sono le rette XY con Y ∈ S2. (Il Lettore faccia un disegno.)

Posto che sia y = ay′+by′′+cy′′′, le coordinate plukeriane pik della retta XY variabile in Σ si esprimonotramite le p′ik di XY ′, le p′′ik di XY ′′ e le p′′′ik di XY ′′′ nel modo seguente:

pik = ap′ik + bp′′ik + cp′′′ik,

ossiap(x,y) = p(x, ay′ + by′′ + cy′′′) = ap(x,y′) + bp(x,y′′) + cp(x,y′′′)

e cio dimostra la (1).

(2) Sia S2 un piano di P3(K). Siano X ′, X ′′, X ′′′ tre punti non allineati di S2 e siano p′ik, p′′ik e p′′′ik lecoordinate plukeriane delle rette X ′′X ′′′, X ′X ′′′, X ′X ′′ rispettivamente. Una qualunque retta S1 del pianoS2 incontra il trilatero X ′X ′′X ′′′ in almeno due punti distinti, siano questi Y ′ ed Y ′′, con ad es. Y ′ ∈ X ′′X ′′′

ed Y ′′ ∈ X ′X ′′′. (Il Lettore faccia un disegno.)Posto che sia y′ = a′x′′ + b′x′′′ ed y′′ = a′′x′ + b′′x′′′, le coordinate plukeriane pik di S1 = Y ′Y ′′ si

esprimono tramite le p′ik, le p′′ik e le p′′′ik nel modo seguente:

69

pik = a′a′′p′ik + b′a′′p′′ik + a′b′′p′′′ik

avendosi:

pik =

y′i y′k

y′′i y′′k

=

a′x′′i + b′x′′′i a′x′′k + b′x′′′k

a′′x′i + b′′x′′′i a′′x′k + b′′x′′′k

,

ossia:

p(y′,y′′) = p(a′x′′ + b′x′′′, a′′x′ + b′′x′′′) = a′a′′p(x′′,x′) + a′b′′p(x′′,x′′′) + b′a′′p(x′′′,x′)

(essendo b′b′′p(x′′′,x′′′) = b′b′′ · 0 = 0). Cio dimostra la (2).

(3) Sia T2 un qualunque piano giacente sulla quadrica di Klein V 24 . Due punti distinti qualunque di T2

sono congiunti da una retta T1 contenuta in T2 e quindi nella V 24 . La retta T1 e immagine di un fascio di

rette di P3(K) (Teorema 42), e quindi quei due punti sono immagini di due rette incidenti di P3(K). Inconclusione l’immagine inversa di T2 e un insieme di rette a due a due incidenti di P3(K), e pertantoe contenuta in una stella di rette o in un piano rigato di P3(K)43. Nel primo caso le rette della stellacorrispondono biunivocamente (per (1) ) ai punti di un piano di tipo σ che evidentemente coincide con T2;nel secondo caso le rette del piano rigato corrispondono biunivocamente (per (2) ) ai punti di un piano di tipoρ che evidentemente coincide con T2. Dunque, in ogni caso, un qualunque piano T2 giacente sulla quadricadi Klein e un piano di tipo σ oppure un piano di tipo ρ. �

A norma del punto (3) del Teorema 43, i piani sulla quadrica di Klein si distribuiscono, come si dice, indue sistemi disgiunti: il sistema dei piani di tipo σ e quello dei piani di tipo ρ.

Teorema 44 Consideriamo due piani distinti giacenti sulla quadrica di Klein. Se essi appartengono allostesso sistema, s’intersecano esattamente in un punto.

Se invece appartengono a sistemi diversi, s’intersecano secondo una retta o non hanno alcun punto incomune.

Dimostrazione. Sappiamo che, sulla quadrica di Klein V 24 , i piani di tipo σ rappresentano le stelle di

rette di P3(K), ed i piani di tipo ρ rappresentano i piani rigati di P3(K).Due stelle distinte di rette di P3(K) hanno in comune esattamente una retta; lo stesso dicasi per due

piani rigati distinti di P3(K); questa retta di P3(K) si rappresenta con un punto di V 24 .

Invece, una stella di rette ed un piano rigato di P3(K) non hanno alcuna retta in comune oppure hannoun fascio di rette in comune, a seconda che il centro della stella appartenga al piano; questo fascio di rettedi P3(K) si rappresenta con una retta di V 2

4 . �

7.2 La superficie di Veronese.

Consideriamo la totalita delle coniche del piano P2 = P2(K) coordinatizzato su un campo K algebricamentechiuso di caratteristica 6= 2. L’equazione di una conica verra scritta come:

43Se le rette non passano tutte per uno stesso punto, ne esistono tre che formano un trilatero; questo determina un piano checontiene anche tutte le altre rette dell’insieme, perche ciascuna di esse contiene almeno due punti distinti del trilatero e quindidel piano.

70

f(a;X) = a00X20 + a11X

21 + a22X

22 + 2a01X0X1 + 2a02X0X2 + 2a12X1X2 = 0.

La matrice della conica e la matrice simmetrica

A = (aik) =

a00 a01 a02

a10 a11 a12

a20 a21 a22

(con aij = aji).

Gli eventuali punti singolari (doppi) della conica sono i punti che annullano il sistema delle derivate parzialiprime di f(a;X), cioe il sistema AX = 0. Una conica e non singolare, cioe e priva di punti doppi, sse la suamatrice ha rango rank(A) = 3, ossia sse det(A) 6= 0. Una conica e singolare sse det(A) = 0; una conicasingolare e necessariamente spezzata in due rette; queste sono distinte sse rank(A) = 2 (e la conica dicesisemplicemente degenere), mentre sono coincidenti sse rank(A) = 1 (e la conica dicesi doppiamentedegenere).

Consideriamo ora lo spazio S5 = S5(K), rappresentativo del sistema lineare completo delleconiche di P2(K). Rappresentiamo la conica d’equazione f(a;X) = 0 con il punto44

P (a) = P (a00, a01, a02, a11, a12, a22) di S5.

Per quanto detto dianzi, abbiamo in S5 la varieta V 34 rappresentativa delle coniche singolari, di

equazione:V 3

4 : F (a) = det(aik) = 0,

che e evidentemente un’ipersuperficie irriducibile d’ordine 3. In S5 abbiamo inoltre la varieta V 42 (contenuta

nella V 34 ) rappresentativa delle coniche doppiamente degeneri, che prende il nome di superficie di

Veronese, le cui equazioni si ottengono annullando i minori d’ordine 2 della matrice A. Si vede facilmenteche la condizione che siano nulli tutti i minori d’ordine 2 di A puo essere equivalentemente espressa con lacondizione che siano nulli tre opportuni di essi: utilizzeremo i seguenti minori per la definizione di V 4

2 :

V 42 : a00a11 − a2

10 = 0, a11a22 − a221 = 0, a01a22 − a21a02 = 0,

equazioni queste che costituiscono le equazioni cartesiane della V 42 . Si tratta effettivamente di una varieta

algebrica di dimensione 2, perche l’appartenenza alla varieta e caratterizzata da tre condizioni algebricheindipendenti per le coordinate di un punto di S5, ed ogni condizione abbassa di un’unita la dimensione.Vedremo poi che la varieta ha ordine 4.

Sia P = P (z), con z = (z0, z1, z2), un punto di P2. Le coniche di P2 che passano per P (z) sono quellela cui stringa a dei coefficienti (che e la stringa delle c.p.o. del corrispondente punto in S5), soddisfa allaf(a;z)) = 0. Questa e una condizione lineare per le aik, ossia rappresenta in S5 un iperpiano S4 chedenoteremo con Lz:

Lz : f(a;z)) =∑

aikzizk = 0.

Scriviamo l’equazione del piu generale iperpiano S4 di S5 nella forma∑aikαik = 0;

denotiamo cioe con αik la coordinata plukeriana che - nell’equazione dell’iperpiano S4 - e coefficiente dellacoordinata aik di punto. Gli iperpiani di S5 formano una totalita lineare di dimensione 5: lo spazio duale

44In questo caso si usa assumere, come coordinata corrispondente ad un monomio del tipo 2aijXiXj , il numero aij anzicheil numero 2aij , il che equivale ad effettuare nello spazio rappresentativo S5 una sostituzione linere invertibile sulle coordinatedi punto con matrice diagonale ad elementi 1 e 2.

71

Σ5 di S5, nel quale le αik sono c.p.o. di punto. Gli iperpiani di tipo Lz, al variare del P (z) in P2, formanouna totalita T di dimensione 2, perche in corrispondenza biunivoca e algebrica coi punti di P2. Taletotalita e un insieme di iperpiani di S5, cioe di punti di Σ5, e si chiama l’immagine proiettiva del sistemalineare delle coniche. Vogliamo provare che l’immagine proiettiva del sistema lineare delle conichesi identifica con la superficie di Veronese V 4

2 . I coefficienti dell’equazione dell’iperpiano Lz (coordinatedel punto Lz di Σ5) sono: αik = zizk. Le equazioni parametriche di:

T = {Lz ∈ Σ5 : P (z) ∈ P2

sono dunque:

T : α00 = z20 , α01 = 2z0z1, α02 = 2z0z2, α11 = z2

1 , α12 = 2z1z2, α22 = z22 (z ∈ K3 \ {0}).

D’altra parte, la superficie di Veronese V 42 e stata definita come l’insieme dei punti P (a) ∈ S5 rappresen-

tativi di coniche doppiamente degeneri, ossia del tipo

(u0X0 + u1X1 + u2X2)2 = 0;

sviluppando il quadrato, si trova dunque che la totalita dei punti P (a) ∈ V 42 ha equazioni parametriche:

V 42 : a00 = u2

0, a01 = u0u1, a02 = u0u2, a11 = u21, a12 = u1u2, a22 = u2

2 (u ∈ K3 \ {0})

che - a parte il nome delle coordinate e dei parametri - si identificano proiettivamente alle equazioni para-metriche di T : basta effettuare una trasformazione diagonale tra le αij e le aij con coefficienti 1 oppure 2 inquanto l’identificazione dei parametri zk coi parametri uk porta alla α00 = a00, alla α01 = 2a01, e cosı via.

Appurato cosı che T ' V 42 , verifichiamo che l’ordine della superficie di Veronese e proprio 4 come

abbiamo indicato senza dimostrazione. A tal fine usiamo la definizione di V 42 come immagine proiettiva:

V 42 = {Lz ∈ Σ5 : P (z) ∈ P2}.

L’ordine di questa varieta e, per definizione, il numero dei punti che essa ha in comune con un generico Σ3

(infatti: 3 = dimensione dello spazio − dimensione della varieta = 5−2). Attualmente (per il Teorema dellastella d’iperpiani45) Σ3 e una stella generica Σ(S1) di iperpiani di S5 di centro una retta generica S1 di S5;questa retta S1 dello spazio rappresentativo e un fascio generico F di coniche di P2. Pertanto:

ordine(V 42 ) =| {Lz ∈ Σ5 : P (z) ∈ P2, Lz ∈ Σ3} |=| {Lz ∈ Σ5 : P (z) ∈ P2, Lz ⊇ S1} |=

= | {Lz ∈ Σ5 : P (z) ∈ P2, ogni conica di F passa per P (z)} |=

=| {P (z) ∈ P2 : ogni conica di F passa per P (z)} |=

| {P (z) ∈ P2 : P (z) e un punto base di F |=

= 4 (per il teor. di Bezout, stante la genericita di F).

Una terza definizione possibile della superficie di Veronese V 42 (come luogo dei punti doppi

della V 34 ) viene fornita dal seguente teorema:

Teorema 45 La superficie di Veronese V 42 e il luogo dei punti multipli (doppi) della ipersuperficie V 3

4 di S5

rappresentiva delle coniche singolari di P2.45Il Teorema della stella di iperpiani afferma che: Ogni stella Σ(Sd) di iperpiani di uno spazio Pr, di centro un Sd di Pr, e

un sistema lineare Σr−d−1 di iperpiani; viceversa ogni sistema lineare Σr−d−1 di iperpiani di Pr e una stella di iperpiani dicentro un Sd di Pr; cfr. nota n. 41.

72

Dimostrazione. Ricordiamo che la V 34 ha in S5 equazione:

V 34 : F (a) = det(A) = det

a00 a01 a02

a10 a11 a12

a20 a21 a22

= 0.

Il luogo dei punti multipli di V 34 e il luogo degli zeri P (a) del sistema delle derivate parziali prime di F :

∂F

∂a00= a11a22 − a2

12,∂F

∂a01= 2(a10a22 − a20a12), . . . ,

∂F

∂a22= a00a11 − a2

01.

e questo e il luogo dei punti P (a) che annullano tutti i minori del secondo ordine della matrice A, cioe e lasuperficie di Veronese, luogo V 4

2 dei punti di S5 che rappresentano le coniche doppiamente singolari di P2.Quanto precede termina la dimostrazione del teorema, notando da ultimo che tutti i punti multipli di V 3

4

sono punti doppi, e non di molteplicita maggiore, perche il sistema delle derivate seconde di F (a) non haautosoluzioni, perche tra quelle derivate seconde ritroviamo (a parte un fattore 2) tutte le coordinate correntia00, a01, a02, a11, a12, a22. �

7.2.1 Comportamento delle rette di S5 rispetto alla V 34 ed alla V 4

2 : coniche degeneri di unfascio.

Ricordiamo che una retta dello spazio S5, rappresentativo delle coniche di P2(K), e un fascio di coniche,e che le varieta V 3

4 e V 42 (la superficie di Veronese) sono le totalita delle coniche degeneri e delle coniche

doppiamente degeneri rispettivamente; si ha dunque

V 42 ⊆ V 3

4 ⊆ S5.

Inoltre la V 42 e il luogo dei punti doppi di V 3

4 ed ogni punto di V 34 \ V 4

2 e un punto semplice. Poichel’ipersuperficie V 3

4 ha ordine tre, ogni retta di S5 interseca V 34 in tre punti (a patto di contarli con la

dovuta molteplicita d’intersezione), oppure giace per intero sulla V 34 ; in altri termini, un fascio di coniche

contiene tre coniche degeneri (a patto di contarle con la dovuta molteplicita) oppure tutte le sueconiche sono degeneri.

Il Lettore effettui dei disegni che illustrino i seguenti esempi di fasci di coniche.

1. Fascio generico di coniche. Ha 4 punti base distinti A,B,C, D e contiene tre coniche semplicementedegeneri: AB ∪ CD, AC ∪BD, AD ∪BC.

2. Fascio di coniche tangenti in A = B. Ha 3 punti base distinti, A = B,C,D e contiene due conichesemplicemente degeneri: AB ∪CD, AC ∪BD = AD ∪BC, dove AB indica la comune tangente in A = B ela seconda conica e contata due volte. (La retta di S5 che rappresenta il fascio e tangente alla V 3

4 nel puntosemplice che rappresenta la seconda conica).

3. Fascio di coniche bitangenti in A = B ed in C = D. Ha 2 punti base distinti, A = B,C = De contiene una conica semplicemente degenere, la AB ∪ CD, e una conica doppiamente degenere, la AC2

contata due volte (e un punto doppio di V 34 ).

4. Fascio di coniche osculantisi in A = B = C. Ha 2 punti base distinti, A = B = C,D, e contieneuna conica semplicemente degenere, la AB ∪ CD contata tre volte. (La retta che rappresenta il fascio e

73

ipertangente alla V 34 nel punto semplice che rappresenta quella conica).

5. Fascio di coniche iperosculantisi in A = B = C = D. Ha un solo punto base, A = B = C = D,e contiene una conica doppiamente degenere, la AB2 contata tre volte; la retta che rappresenta il fascio etangente alla V 3

4 nel punto doppio che rappresenta quella conica.6. Fascio di tutte coniche degeneri che condividono una componente, costituito da una retta

fissa r e da una retta s variabile in un fascio di rette di centro un punto P . Indicheremo tale fascio di conichecon

λ(r, P );

poniamo inoltreΛ1 = {λ(r, P ) : P e un punto ed r e una retta di P2}.

Evidentemente il fascio λ(r, P ) contiene o non contiene una conica doppiamente degenere (che e necessaria-mente la r2) a seconda che sia P ∈ r oppure P /∈ r; la retta che rappresenta il fascio e contenuta nella V 3

4

ed e tangente alla V 42 nel primo caso.

Analiticamente: sia r(x) = 0 l’equazione della retta r e sia λs1(x) + µs2(x) = 0 l’equazione della rettavariabile nel fascio di rette, generato da due rette s1 e s2 passanti per P . L’equazione della conica variabilenel fascio di coniche tutte degeneri e

λ(r, P ) : r(x)[λs1(x) + µs2(x)] = 0, cioe λ[r(x)s1(x)] + µ[r(x)s2(x)] = 0.

7. Fascio di tutte coniche degeneri che condividono il punto doppio, costituito da coppie dirette appartenenti ad uno stesso fascio di centro un punto P . Il fascio e individuato da P e da due conichedegeneri, r1 ∪ s1 ed r2 ∪ s2, con P = r1 ∩ s1 = r2 ∩ s2 e pertanto verra indicato con

λ(P, r1s1, r2s2);

poniamo inoltreΛ2 = {λ(P, r1s1, r2s2) : P = r1 ∩ s1 = r2 ∩ s2}.

In questo caso il fascio contiene esattamente due coniche doppiamente degeneri. La retta che rappresenta ilfascio e contenuta nella V 3

4 ed bisecante la V 42 .

Esempio: Fascio di coniche generato dalla conica f1,0 di equazione X20 = 0 e dalla conica f0,1 di

equazione X21 = 0. Le coniche del fascio sono le coniche

fλ,µ; λX20 − µX2

1 = 0 (λ, µ) 6= (0, 0)

tutte degeneri perche

fλ,µ; λX20 − µX2

1 = (√

λX0 +√

µX1)(√

λX0 −√

µX1) = 0.

Il fascio non contiene coniche doppiamente degeneri diverse dalle coniche f1,0 ed f0,1 perche se λ 6= 0 e µ 6= 0,allora la retta

√λX0 +

õX1 = 0 e distinta dalla retta

√λX0 −

õX1 = 0.

Lemma 46 . Ogni retta S1 di S5 che abbia due punti in comune con la superficie di Veronese V 42 giace per

intero sulla V 34 . Inoltre una retta S1 di S5 ha al piu due punti in comune con V 4

2 . Pertanto i punti di V 42

sono a tre a tre non allineati. Ne segue che la V 42 non contiene rette.

Dimostrazione. Si tratta di provare che se un fascio di coniche di P2 contiene due coniche distinte doppi-amente degeneri, allora ogni altra conica del fascio e degenere ma non e doppiamente degenere. In effetti,

74

non e restrittivo supporre che le due coniche doppiamente degeneri siano le coniche di equazione X20 = 0 e

X21 = 0 rispettivamente, e sviluppare l’argomento svolto nell’Esempio di cui sopra. �

Dimostriamo ora che i soli casi di fasci di tutte coniche degeneri sono quelli detti in 6 e 7.

Teorema 47 (Classificazione dei fasci di tutte coniche degeneri). Sia F un fascio di coniche, tuttedegeneri, di P2. Allora necessariamente si verifica uno dei due casi seguenti:

(1) Le coniche di F condividono una componente, ossia F e un fascio di coniche con una componentefissa e l’altra variabile in un fascio di rette.

(2) Le coniche di F condividono il punto doppio, ossia F e un fascio di coniche spezzate in due rette perun punto fissato.

Dimostrazione. Per il Lemma 46, F ha al piu due coniche doppiamente degeneri. Pertanto F e generabileda due coniche semplicemente degeneri: f1 = r1 ∪ s1, f2 = r2 ∪ s2, dove dunque r1 6= s1 e r2 6= s2.

Se f1 ed f2 condividono una componente, ad es. r1 = r2 = r, questa e anche componente di ogni altraconica f = λf1 + µf2 di F , e siamo nel caso (1).

Se f1 ed f2 condividono il punto doppio, cioe se r1 ∩ s1 = r2 ∩ s2 = P , allora P e punto doppio per ognif ∈ F (perche in P si annullano le derivate parziali prime di f , in quanto vi si annullano quelle di f1 e dif2) e dunque ogni f ∈ F si spezza in due rette per P , e siamo nel caso (2).

Supponiamo che f1 ed f2 non condividano il punto doppio, cioe che sia P1 = r1 ∩ s1 6= r2 ∩ s1 = P2.Evidentemente si hanno soltanto le seguenti tre possibilita:

P2 ∈ r1 ∪ s1, P1 ∈ r2 ∪ s2, (P2 /∈ r1 ∪ s1) ∧ (P1 /∈ r2 ∪ s2).

(Il Lettore effettui figure corrispondenti ai tre casi suddetti). Nei primi due casi si hanno tre punti basenon allineati, il trilatero dei quali e formato da componenti di f1 e di f2. Una terza conica f3 di F si spezzain due rette, una delle quali necessariamente e un lato del trilatero, ad es. s2. Pertanto f3 ed f2 condividonouna componente e dunque F =< f2, f3 > e del tipo (1). Il terzo caso non puo verificarsi. Infatti nel terzocaso i punti base formano un quadrangolo ed esistono soltanto tre coniche degeneri per tali quattro punti.�

7.2.2 Comportamento dei piani di S5 rispetto alla V 34 ed alla V 4

2 : coniche degeneri di una rete.

Ricordiamo ancora una volta che i piani dello spazio S5 rappresentativo delle coniche di P2 = P2(K) sonole reti di coniche di P2 e che le varieta V 3

4 e V 42 (la superficie di Veronese) sono le totalita delle coniche

degeneri e delle coniche doppiamente degeneri rispettivamente e che inoltre la V 42 e il luogo dei punti doppi

di V34, cosicche ogni punto di V 3

4 \ V 42 e un punto semplice.

Un piano di S5 contenuto in V 34 rappresenta evidentemente una rete di coniche di P2 tutte degeneri.

Il primo sistema Π1 di piani sulla V 34 . (Reti di coniche con componente comune). Se tre

coniche di P2 indipendenti (cioe non formanti fascio) f1, f2, f3 sono degeneri e condividono una componentecomune r, fatto che esprimeremo usando una notazione compatta e semplificata del tipo:

f1 = rs1, f2 = rs2, f3 = rs3,

allora ogni conicaf = λ1f1 + λ2f2 + λ3f3 = r(λ1s1 + lλ2s2 + λ3s3)

75

della rete < f1, f2, f3 > e degenere e condivide quella componente, mentre la sua componente residuaλ1s1 + λ2s2 + λ3s3 descrive tutte le rette di P2 perche le rette s1, s2, s3 sono indipendenti (tali essendo lef1, f2, f3).

Denotiamo con π(r) il piano di S5, contenuto in V 34 , che rappresenta la rete delle coniche degeneri che

condividono la componente r:π(r) = {rs ∈ V 3

4 : s retta di P2},

e denotiamo conΠ1 = {π(r) : r retta di P2}

la totalita dei piani cosı ottenuti su V 34 al variare della retta r in P2.

Il secondo sistema Π2 di piani sulla V 34 . (Reti di coniche che condividono il punto doppio).

Se tre coniche di P2 indipendenti f1, f2, f3 sono semplicemente degeneri e condividono il punto doppio P :

f1 = r1s1, f2 = r2s2, f3 = r3s3, r1 ∩ s1 = r2 ∩ s2 = r3 ∩ s3 = P,

allora ogni conica

f = λ1f1 + λ2f2 + λ3f3 = λ1(r1s1) + λ2(r2s2) + λ3(r3s3)

della rete < f1, f2, f3 > ha P come punto doppio (perche in P si annullano tutte le derivate parziali dif1, f2, f3 e quindi quelle di f) ed e dunque degenere in due rette contenenti P , cioe f = rs con P ∈ r, s (ovepuo anche essere r = s).

Viceversa una qualunque coppia di rette r, s contenenti P e tale che f = rs sia combinazione lineare dellef1, f2, f3. Infatti, da un punto di vista astratto, il fascio di rette di P2 di centro P e (nel piano duale di P2)una retta S1 ed ogni coppia di rette per P e una coppia di punti di S1 (quadrica di S1); pertanto la totalitadelle coppie di rette per P e la totalita delle quadriche di S1 e quindi costituisce uno spazio proiettivo didimensione N = N(r, n) = N(1, 2) = 2 (in effetti e la serie lineare completa g2

2 dei gruppi di 2 punti diS1), ossia e un ”piano proiettivo”, cosicche ogni suo punto f e generabile linearmente dai suoi tre puntiindipendenti f1, f2, f3.

Denotiamo con π(P ) il piano di S5, contenuto in V 34 , che rappresenta la rete delle coniche degeneri di P2

che condividono il punto doppio P :

π(P ) = {rs ∈ V 34 : P ∈ r, s},

e denotiamo conΠ2 = {π(P ) : P punto di P2}

la totalita dei piani cosı ottenuti su V 34 al variare del punto P in P2.

Teorema 48 . (Classificazione delle reti di tutte coniche degeneri). Sia π un piano di S5 contenutoin V 3

4 . Allora π ∈ Π1 oppure π ∈ Π2. In altri termini: una rete di coniche tutte degeneri di P2 e costituitada tutte le coniche spezzate in una retta fissa ed in una retta qualunque del piano, oppure da tutte le conichespezzate in due rette per uno stesso punto.

Dimostrazione. Consideriamo π generato da tre suoi punti non allineati, f1, f2, f3. Su ogni lato di taletriangolo esistono al piu due punti di V 4

2 (per il Lemma 46), onde non e restrittivo supporre che ogni fi

corrisponda ad una conica semplicemente degenere. Ciascuno dei tre lati di quel triangolo e una retta,necessariamente appartenente a Λ1 (ossia e un fascio di coniche con componente comune) oppure a Λ2 (ossia

76

e un fascio di coniche con punto doppio comune), cfr. Teorema 47.Se in π esistono tre punti non allineati corrispondenti a tre coniche (degeneri) di P2 che condividono una

componente r, allora ogni punto di π corrisponde ad una conica di P2 che condivide la componente r, equindi π ∈ Π1.

Supponiamo allora che, per qualunque triangolo di π, i suoi tre vertici f1, f2, f3 corrispondano a conicheche non condividono una componente. Si possono presentare tre casi . Il Lettore faccia un disegno deltriangolo, segnando ciascun vertice f del triangolo (e analogamente segnando ogni altro punto nominato incio che segue) come ’prodotto’ f = ab delle due rette che vengano indicate come componenti della conica f .

Se (almeno) due lati, ad es. f1f2 ed f1f3, appartengono a Λ2, allora f1 condivide il punto doppio sia conf2 sia con f3, cosicche f1, f2 ed f3 condividono fra loro il punto doppio, e quindi π ∈ Π2.

Se un solo lato, ad es. f1f3, appartiene a Λ2, mentre f1f2 ed f2f3 appartengono a Λ1, possiamo assumereintanto f1 = rs, f2 = rt. Poiche f2f3 ∈ Λ1, una componente di f3 deve essere r oppure t, ma non puo esserer perche f1, f2 ed f3 non condividono una componente, e dunque una componente di f3 deve essere t cont 6= r. Sia dunque f1 = rs, f2 = rt, f3 = ht con t 6= r.

Possiamo assumere f4 ∈< f2, f3 >, con f4 = kt, k 6= r. Allora π =< f1, f4, f3 > ed e π ∈ Π2. perche iltrilatero generatore ha i due lati f1f3 ed f1f4 appartenenti a Λ2.

Se infine tutti i lati appartengono a Λ1, allora le coniche f1, f2 ed f3 condividono a due a due unacomponente comune, che tuttavia non puo essere comune a tutte e tre; pertanto si puo supporre che sia ades. f1 = rt, f2 = rs, f3 = st.

Possiamo assumere:

f4 ∈< f1, f3 >, con f4 = ht, h 6= s, f5 ∈< f2, f3 >, con f5 = sv, v 6= r.

Allora π =< f1, f4, f5 > ed attualmente il trilatero generatore ha i due lati f1f5 ed f4f5 in Λ2 e quindiπ ∈ Π2 per quanto visto. Cio completa la dimostrazione. �

Teorema 49 Consideriamo i due sistemi Π1 e Π2 di piani contenuti sulla V 34 .

(1) Per ogni punto di V 34 \ V 4

2 passano esattamente due piani di Π1 (che si intersecano esattamente inquel punto) ed esattamente un piano di Π2. Inoltre due piani distinti di Π1 si intersecano in esattamente unpunto di V 3

4 \ V 42 ; due piani distinti di P2 s’intersecano in esattamente un punto di V 4

2 ; un piano di Π1 edun piano di Π2 non hanno punti in comune oppure hanno esattamente una retta in comune.

(2) Per ogni punto di V 42 passa un unico piano di Π1 ed ∞1 piani di Pi2.

(3) Ogni piano di Π1 e tangente a V 42 .

(4) Ogni piano di Π2 interseca V 42 secondo una conica non singolare.

(5) Detto Γ = {π∩V 42 : π ∈ Π2} l’insieme delle coniche segate sulla V 4

2 dai piani di Π2, si ha che (V 24 ,Γ)

e un piano proiettivo.

Dimostrazione. Denotiamo con r, s due rette qualunque e con P,Q due punti qualunque di P2. Allora:

(1) Si ha:

(r 6= s) rs ∈ V 34 \ V 4

2 ⇒ rs ∈ π(r) ∈ Π1, rs ∈ π(s) ∈ Π1, {rs} = π(r) ∩ π(s), rs ∈ π(r ∩ s) ∈ Π2.

Si ha poi:π(P ) 6= π(Q) ⇒ P 6= Q ⇒ π(P ) ∩ π(Q) = (PQ)2 ∈ V 4

2 .

Inoltre:

π(r) ∩ π(P ) = ∅ se P /∈ r, mentre π(r) ∩ π(P ) = {rs : s 3 P} se P ∈ r.

(2). Infatti:rr ∈ V 4

2 ⇒ [(rr ∈ π(r) ∈ Π1) ∧ (∀P ∈ r : rr ∈ π(P ) ∈ Π2)].

77

(3). Infatti:π ∈ Π1, π = π(r) ∈ Π1 ⇒ π ∩ V 4

2 = {rr}.

(4). Infatti, siaπ ∈ Π2, con π = π(P ) = {rs : r ed s rette di P2 passanti per P},

Non e restrittivo assumere P = A0(1, 0, 0). Posto poi

r : u1X1 + u2X2 = 0, s : v1X1 + v2X2 = 0,

si hars : (u1X1 + u2X2)(v1X1 + v2X2) = u1v1X

21 + (u1v2 + u2v1)X1X2 + u2v2X

22 = 0),

ossiaπ(P ) : a11X

21 + a12X1X2 + a22X

22 = 0,

dovea11 = u1v1, a12 = u1v2 + u2v1, a22 = u2v2. (8)

Il piano π(P ) ha equazioni cartesiane in S5:

a00 = 0, a01 = 0, a02 = 0. (9)

Le coordinate del punto rs variabile in π(P ) sono:

a00 = 0, a01 = 0, a02 = 0, a11 = u1v1, a12 = u1v2 + u2v1, a22 = u2v2.46 (10)

I punti di π(P )∩V 42 si ottengono ponendo r = s (cioe u1 = v1, u2 = v2, ) in tutto quanto precede; dalla (10)

si ha allora:π(P ) ∩ V 4

2 = {(0, 0, 0, u21, 2u1u2, u

22) : (u1, u2) ∈ K \ {(0, 0}.

Questa formula dice che - nelle coordinate interne (a11, a12, a22) del piano π(P ) che ha equazioni (9) - illuogo π(P ) ∩ V 4

2 ha equazioni parametriche a11 = u21, a12 = 2u1u2, a22 = u2

2, ossia ha equazione cartesiana

4a11a22 − a212 = 0,

che e l’equazione di una conica non singolare, come asserito.

(5) Siano r2 ed s2 punti distinti di V 42 . Allora π = π(r ∩ s) e l’unico piano di Π2 che li contiene, cosicche

π ∩ V 42 e l’unica conica di Γ per quei due punti. Siano ora C e C ′ due coniche distinte appartenenti a Γ. Sia

C = π ∩ V 42 e C ′ = π′ ∩ V 4

2 , con π, π′ ∈ Π2. Allora π = π(P ), π′ = π(Q) per opportuni punti P,Q di P2; siha allora C ∩C ′ = π∩π′ = (PQ)2 che e un punto di V 4

2 . Infine, evidentemente, ogni conica contiene almenotre punti, e cio completa la dimostrazione. �

7.3 Veronesiana V nr

r delle ipersuperfici d’ordine n di Pr(K).

La superficie di Veronese V 42 - rappresentativa in S5 del sistema algebrico delle coniche doppiamente degeneri,

o, se si preferisce, immagine proiettiva (nel duale Σ5 di S5) del sistema lineare completo delle coniche diP2(K) - e caso particolare (r = n = 2) della varieta di Veronese V nr

r .46Viceversa, ogni punto P (0, 0, 0, a11, a12, a22) del piano di S5 avente in S5 equazioni cartesiane (9) e immagine di una (unica)

conica rs della rete π(P ): cio e evidente a priori in virtu delle proprieta della rappresentazione lineare delle coniche di P2 coipunti di S5; a conferma di cio si noti che il sistema (8) e univocamente risolubile nelle coppie omogenee (u1, u2) e (v1, v2).

78

Questa varieta verra ora introdotta sia come la varieta rappresentativa in SN del sistema algebrico delleipersuperfici d’ordine n di Pr(K). spezzate in n iperpiani coincidenti, sia, equivalentemente, come immagineproiettiva (nel duale ΣN di SN ) del sistema lineare completo delle ipersuperfici d’ordine n di Pr(K). Inparticolare (r = 2) si ha la superficie veronesiana V n2

2 delle curve piane d’ordine n.

Consideriamo lo spazio proiettivo Pr = Pr(K) di dimensione r sul campo K (algebricamente chiuso), edindichiamo con X = (X0, X1, . . . , Xr) le c.p.o. di punto in Pr.

Sia SN lo spazio rappresentativo delle ipersuperfici f d’ordine n di Pr. Scriviamo l’equazione della piugenerale ipersuperficie f nella forma

f : f(a;X) =∑

s0+s1+···+sr=n

as0s1...srXs00 Xs1

1 · · ·Xsrr = 0,

dove la somma e estesa a tutte le soluzioni in interi non negativi dell’equazione diofantea:

s0 + s1 + · · ·+ sr = n,

e dove conveniamo di scrivere i monomi in un ordine stabilito una volta per tutte. Sappiamo che il numerodei coefficienti di f(a;X), ossia il numero delle soluzioni (s0, s1 . . . , sr) di tale equazione diofantea, e

N + 1 =(

r + n

n

)e che l’ipersuperficie f si rappresenta come il punto P (a) dello spazio SN .

Conveniamo di scrivere l’equazione di un iperpiano di Pr nella forma

r∑i=0

uiXi = 0

e l’equazione di un iperpiano di SN nella forma∑s0+s1+···+sr=n

as0s1...srαs0s1...sr

= 0.

Indichiamo con ΣN lo spazio duale di SN . Le coordinate di punto in ΣN sono le coordinate plukerianed’iperpiano αs0s1...sr

in SN .

Sia ora P = P (z), z = (z0, z1, . . . , zr) un punto di Pr. Le ipersuperfici d’ordine n di P r che passano perP (z) sono quelle la cui stringa a dei coefficienti, soddisfa alla f(a;X) = 0. Questa e una condizione lineareper le as0s1...sr

, ossia rappresenta un iperpiano SN−1 che denoteremo con Lz:

Lz : f(a; z) =∑

s0+s1+···+sr=n

as0s1...srzs00 zs1

1 · · · zsrr = 0.

Questo iperpiano Lz ha coordinate plukeriane

Lz : αs0s1...sr = zs00 zs1

1 · · · zsrr , con (z0, z1, . . . , zr) ∈ Kr+1 \ {0}). (11)

Gli iperpiani di tipo Lz (al variare di P (z) in Pr) formano in ΣN una varieta algebrica Vr di dimensioner, perche gli Lz sono in corrispondenza biunivoca e algebrica coi punti di Pr), corrispondenza esplicitatanelle precedenti equazioni parametriche di Vr nei parametri zi. Tale varieta Vr:

Vr = {Lz ∈ ΣN : P (z) ∈ Pr)} ⊆ ΣN .

79

si chiama la immagine proiettiva del sistema lineare completo47 delle ipersuperfici d’ordine n di Pr, eprende il nome di varieta di Veronese delle ipersuperfici d’ordine n di Pr.

Vogliamo ora provare che l’ordine di questa varieta di Veronese Vr e nr, ossia che la varieta e una V nr

r .Per definizione, l’ordine della varieta di Veronese Vr ⊆ ΣN e il numero dei punti che essa ha in comune

con un generico ΣN−r: attualmente (per il Teorema della stella di iperpiani) ΣN−r = Σ(Sr−1) e una stellagenerica di iperpiani di SN di centro un generico sottospazio Sr−1 di SN ; questo Sr−1 e (rappresenta) ungenerico sistema lineare (r − 1)-dimensionale di ipersuperfici d’ordine n di Pr, e come tale e generato da ripersuperfici generiche - f1, f2, . . . , fr - d’ordine n di Pr, ed ha come varieta base l’intersezione di queste ripersuperfici, cioe un gruppo di nr punti in virtu del teorema di Bezout (Teorema 33). Riassumendo:

ordine(Vr) =| {Lz ∈ ΣN : P (z) ∈ Pr, Lz ∈ ΣN−r |=| {Lz ∈ ΣN : P (z) ∈ Pr, Lz ⊇ Sr−1} |=

= | {Lz ∈ ΣN : P (z) ∈ Pr, ogni f di Sr−1 passa per P(z)} |=

=| {P (z) ∈ Pr : ogni f di Sr−1 passa per P (z)} |=

=| {P (z) ∈ Pr : P (z) e un punto base di Sr−1 |=| f1 ∩ f2 ∩ · · · ∩ fr |=

= nr (per il teor. di Bezout, stante la genericita delle fi).

Evidenziando il valore dell’ordine, denoteremo con V nr

r la varieta di Veronese suddetta.

Dimostriamo ora che la varieta di Veronese V nr

r , che e stata qui presentata come una varieta immersanel duale ΣN dello spazio SN rappresentativo delle ipersuperfici di ordine n di Pr = Pr(K), si identifica(e proiettivamente equivalente) alla varieta algebrica immersa in SN costituita dai punti di SN che rapp-resentano le ipersuperfici d’ordine n di Pr spezzate in n iperpiani coincidenti.

Una ipersuperfici Hn d’ordine n di Pr spezzata in n iperpiani coincidenti, ha un’equazione del tipo:

(u0X0 + u1X1 + · · ·+ urXr)n = 0;

sviluppando la potenza del polinomio, si trova

Hn : (u0X0 + u1X1 + · · ·+ urXr)n =∑

s0+s1+···+sr=n

n!s0!s1! · · · sr!

us00 us1

1 · · ·usrr Xs0

0 Xs11 · · ·Xsr

r = 0,

dove al solito la somma e estesa a tutte le soluzioni in interi non negativi dell’equazione diofantea:

s0 + s1 + · · ·+ sr = n,

Dunque il luogo dei punti P (a) ∈ SN che rappresentano le ipersuperfici del tipo Hn ha equazioni paramet-riche:

as0s1...sr =n!

s0!s1! · · · sr!us0

0 us11 · · · rsr

r , con (u0, u1, . . . , ur) ∈ Kr+1 \ {0}

Queste equazioni si identificano proiettivamente - a parte il nome delle coordinate e dei parametri - alleequazioni parametriche (11) di V nr

r : basta identificare le zi con le ui ed effettuare una trasformazionediagonale tra le as0s1...sr e le αs0s1...sr con matrice diagonale ad elementi che sono coefficienti multinomiali.

47In modo del tutto analogo si definisce la immagine proiettiva di un qualunque sistema lineare d-dimensionale Td di ipersu-perfici di ordine n di Pr, anche non completo, cioe di dimensione d < N : le ipersuperfici del sistema lineare Td si rappresentanocome punti di un sottospazio Sd dello spazio rappresentativo SN ed ogni punto generico P (z) di Pr stacca nel sistema lineareTd un sottosistema (d − 1)-dimensionale che si rappresenta con un iperpiano di Sd, ossia con un punto del duale Σd di Sd.L’immagine proiettiva del sistema lineare Td e la varieta di questi iperpiani di Sd.

80