(Francesco Caranti - Opzioni in laboratorio - Statistica e · la pena, se non altro per aver...

83
Francesco Caranti Opzioni in laboratorio Statistica e Indicatori di Borsa in Excel Parte 2^ Raccolta gratuita di esercitazioni www.francescocaranti.net Bologna, giugno 2013

Transcript of (Francesco Caranti - Opzioni in laboratorio - Statistica e · la pena, se non altro per aver...

Francesco Caranti

Opzioni in laboratorio

Statistica e Indicatori di Borsa in Excel Parte 2^

Raccolta gratuita di esercitazioni

www.francescocaranti.net Bologna, giugno 2013

75

Indice

Cap. Pag.

31 Excel: PREVISIONE e TENDENZA - Formule matriciali 77

32 Minimi quadrati in Excel 82

33 Angolo e pendenza della Regressione Lineare in Excel 87

34 Visualizzare la Regressione Lineare in Excel 90

35 Collegamenti tra funzioni Excel 95

36 RQ e SLOPE in Excel 99

37 RQ e SLOPE in Excel (2^ parte) 105

38 RQ e SLOPE in Excel (3^ parte) 112

39 TSF - Time Series Forecast 117

40 Standard Error e Bande di Andersen 121

41 Standard Error e Bande di Andersen 2^ parte 125

42 Raff Regression Channel 131

43 Raff Regression Channel 2^ parte 134

44 Oscillatore Stocastico 137

45 CMO: Chande Momentum Oscillator 141

46 Parabolic SAR - parte 1 145

47 Parabolic SAR - parte 2 148

48 Parabolic SAR - parte 3 153

49 The End 155

76

Indice del software

Francesco Caranti"Opzioni in Laboratorio"

Statistica e Indicatori di Borsa in Excel www.francescocaranti.net

Saggio gratuito di esercitazionea integrazione della dispensa

Release giugno 2013

Nota: i fogli sono protetti per non danneggiare le formule.E' possibile togliere la protezione utilizzando psw "CARANTI"

Foglio Capitolo PaginaTopolinia PREVISIONE e TENDENZA - Formule matric 77MinimiQuadrati MINIMI QUADRATI IN EXCEL 82Pendenza Angolo e pendenza della RL 8734-LR Visualizzare la regressione lineare 9034-LR Grafo Visualizzare la regressione lineare 9035-A 35-B Collegamenti tra funzioni 95RQ RQ e SLOPE in Excel 10539-TSF TSF - Time Series Forecast 117Dev.std - Err.std Standard Error e Bande di Andersen 12142-Raff Raff Regression Channel 13143-R.A.B. Raff Regression Channel 2^ parte 13444-Stoc Oscillatore Stocastico 13745-CMO CMO: Chande Momentum Oscillator 14148-Parabolic Parabolic SAR 153

TAVOLA DEI CONTENUTI

77

Opzioni in laboratorio 31 Excel: PREVISIONE e TENDENZA Formule matriciali Ovviamente stiamo scherzando perch questo piatto di spaghetti allamatriciana nulla ha a che vedere con Excel. Mentre Amatrice resta un paesello vicino a Rieti dove pare abbiano inventato questo condimento sopraffino, una matrice in matematica altro non che una griglia di righe e di colonne. E poich Excel vive proprio di righe e di colonne, sono parecchie le acrobazie che si possono fare con questo strumento informatico potentissimo. Ma, come al solito, dobbiamo andare per gradi. Come certamente ricorderete, il nostro studio sugli Indicatori Tecnici di Borsa si era concentrato sulla Regressione Lineare, ma se vi fosse rimasto qualche dubbio potete rispolverare i contributi n.18, 19 e 20. In quella occasione, partendo dallesempio di una biglia in movimento, siamo passati allequazione di Gauss dei minimi quadrati e alla funzione corrispondente di Excel: =PREVISIONE. Nota: Attenzione a non confondere gli studi sulla Regressione Lineare (=PREVISIONE) con quelli della pi recente Deviazione Standard (=DEV.ST.POP). In estrema sintesi, la funzione PREVISIONE permette di trovare quella retta teorica che meglio si presta a interpolare le coppie di punti delle nostre osservazione. Poi, procedendo per estrapolazione si possono trovare i punti futuri sul grafico>. Per rinfrescare la memoria, rivediamo la regressione della dispensa 18 perch ci che conta che sia chiaro ci di cui stiamo parlando:

Retta di regressione

-2

0

2

4

6

8

10

12

-2 -1 0 1 2 3 4 5 6 7

X

Y

78

Una volta ottenuta questa retta, se prendo un righello e lo posiziono in punto qualsiasi dellasse X (es: 6,5) posso subito vedere a colpo docchio quale sar il corrispondente Y. Naturalmente in questo modo si va poco lontani perch il metodo a colpo docchio fin troppo empirico, ma la sostanza che questa retta ha una sua precisa equazione e la funzione PREVISIONE la conosce talmente bene da essere in grado di trovare lY corrispondente con precisione diabolica. Oggi ancora presto per analizzare lequazione di questa retta di regressione perch temo che sia molto facile andare nel pallone, per cui preferisco fare ancora un altro esempio fuori dalla Borsa: parleremo di tuttaltro, cio dellinquinamento di un lago. Lequazione solo rimandata, ma bene studiarla perch fondamentale per capire lingranaggeria Excel di queste sette funzioni fondamentali:

PREVISIONE TENDENZA PENDENZA RQ ERR.STD.YX REGR.LIN PEARSON

Quando avremo compreso e interiorizzato le connessioni delle 7 funzioni, potremo ritenerci soddisfatti e molto pi sicuri nelle interpretazioni di Borsa che faremo. Quello che voglio fare oggi un esempio che ci servir a descrivere la funzione TENDENZA che, passatemi il termine, una parente stretta di quella PREVISIONE che gi conosciamo. Via, si parte! Il Ministero dellAmbiente ha rilevato che il lago Schifezza nel comune di Topolinia inquinato al punto di aver bisogno di un impianto di depurazione per poi iniziare un programma di ripopolamento ittico. Una volta installato limpianto, ogni mese unequipe di esperti preleva un campione delle acque e registra lIndice di inquinamento: un numero che, col tempo, dovrebbe calare. Dopo un anno esatto si ottiene questa matrice: Come potete vedere in sfondo giallo, se vogliamo sapere cosa ne sar dellinquinamento al mese 13 basta applicare la formula: PREVISIONE(x;y_nota;x_nota) in cui x la cella C11 che

Comune di Topolinia - Lago Schifezza

Rilevazione Indice di Inquinamento

Mese Indice

X Y

1 254 13 114,45

2 241 =PREVISIONE(C11;B11:B22;A11:A22)

3 233

4 212

5 201

6 195

7 184

8 172

9 159

10 147

11 139

12 128

79

contiene il valore 13, y_nota il vettore B11:B22 (cio le rilevazioni) e x_nota la sequenza dei mesi conosciuti. Fin qui niente di strano, tutto coincide col precedente esempio della biglia della dispensa 18. Il fatto nuovo, invece, che oltre a PREVISIONE esiste unaltra formula Excel a nome TENDENZA che, come vedremo, oltre a replicare i risultati di PREVISIONE, in realt riesce a fare un po di pi. Vediamo al volo la coincidenza dei risultati applicando TENDENZA al problema del lago Schifezza. Come volevasi dimostrare, i risultati di PREVISIONE e TENDENZA coincidono alla perfezione: al 13 mese il livello di inquinamento sar sceso a 114,45. Nota: Attenzione allo scambio dei parametri nelle due funzioni. In PREVISIONE il valore da cercare (x) in cella C11 viene posto allinizio di parentesi mentre in TENDENZA cade alla fine. Fin qui, entrambe le funzioni restituiscono un unico valore nel senso che uno soltanto stato il valore richiesto dalla formula, cio il 13 mese. Il problema cambia quando al posto di unico risultato viene richiesta una matrice di risultati. Nel caso specifico, non ci dispiacerebbe sapere cosa pu accadere contemporaneamente al 13, 14 e 15 mese della nostra esplorazione statistica. Per far ci possiamo utilizzare solo ed esclusivamente TENDENZA che, come dicevamo, pi performante della precedente PREVISIONE. In conclusione, mentre PREVISIONE si ferma alla determinazione di un solo valore, TENDENZA pu determinarne contemporaneamente pi di uno. Cominciamo a fissare le idee con la sintassi della funzione: TENDENZA(y_nota;x_nota;nuova_x;cost) in cui il terzo parametro pu essere una matrice anzich una voce singola. Vediamo lesempio:

Comune di Topolinia - Lago Schifezza

Rilevazione Indice di Inquinamento

Mese Indice

X Y

1 254 13 114,45

2 241 =PREVISIONE(C11;B11:B22;A11:A22)

3 233

4 212

5 201 114,45

6 195 =TENDENZA(B11:B22;A11:A22;C11)

7 184

8 172

9 159

10 147

11 139

12 128

80

Come potete vedere, TENDENZA non ha restituito UN SOLO VALORE bens una MATRICE DI VALORI, cio contemporaneamente 3 celle con questi risultati: 114,45 per il 13 mese, 103,02 per il 14 e 91,59 per il 15. E questo il vero vantaggio di questa incredibile formula: risultati complessi e contemporanei. Attenzione per perch per poter funzionare, questa funzione ha la necessit di essere inserita come FORMULA MATRICE perch se la eseguiamo normalmente come copia-incolla di formula non d i risultati sperati. Alt! A questo punto dobbiamo fare luce sulla questione, se no non si capisce! Andiamo con le domande:

1. Quando una FORMULA MATRICE ? 2. Perch una FORMULA MATRICE ? 3. Come si fa a fare una FORMULA MATRICE ? 4. Come si riconosce una FORMULA MATRICE ?

E ora le risposte, partendo dalla definizione della letteratura: Alcune funzioni dei fogli di lavoro restituiscono matrici di valori o richiedono una matrice di valori come argomento. Per calcolare pi risultati con una formula in forma di matrice, occorre immettere la matrice in un intervallo di celle che abbia lo stesso numero di righe e colonne degli argomenti matrice . Chiaro? Certo che no. Io non ho capito! Partiamo da qui: Alcune funzioni dei fogli di lavoro restituiscono matrici di valori o richiedono una matrice di valori come argomento . Ma alcune quali? Mi chiedo io? Occorre saperlo prima ma con un po di pratica si scopre che sono le funzioni nella cui sintassi della Guida in linea di Excel inclusa la parola matrice.

Comune di Topolinia - Lago Schifezza

Rilevazione Indice di Inquinamento

Mese Indice

X Y

1 254 13 114,45

2 241 =PREVISIONE(C11;B11:B22;A11:A22)

3 233

4 212

5 201 114,45

6 195 =TENDENZA(B11:B22;A11:A22;C11)

7 184

8 172

9 159

10 147

11 139

12 128

13 114,45 =TENDENZA(B11:B22;A11:A22;A24:A26)

14 103,02 =TENDENZA(B11:B22;A11:A22;A24:A26)15 91,59 =TENDENZA(B11:B22;A11:A22;A24:A26)

81

Infatti se vado nella Guida alla voce TENDENZA scopro che: Restituisce i valori lungo una tendenza lineare. Utilizzando il metodo dei minimi quadrati, calcola una retta che coincide con le matrici y_nota e x_nota e restituisce i valori y lungo la retta per la matrice di nuova_x specificata . Quindi la risposta alla domanda 1) : quando lo dice la sintassi della Guida Veniamo alla domanda 2): Perch una formula matrice? La risposta : 2) quando hai pi dati da elaborare contemporaneamente E ora la domanda 3). Come si crea una Formula Matrice? Questi sono i passi:

a) selezionare lintervallo di celle per le quali vogliamo trovare i risultati (nel nostro caso occorrer selezionare da D24 a D26)

b) inserire la formula nella barra della formula =TENDENZA(B11:B22;A11:A22;A24:A26) c) anzich fare il classico INVIO, eseguire il comando contemporaneo

CTRL+MAIUSCOLO+INVIO Domanda 4: come si riconosce una Formula Matrice? Semplice: la formula matrice sempre preceduta e seguita da una parentesi graffa che si pu vedere SOLO nella barra della formula:

{=TENDENZA(B11:B22;A11:A22;A24:A26)} Nota: Excel racchiude automaticamente la formula tra parentesi graffe{ }. Non possibile immettere le parentesi manualmente. In questo caso, infatti, la formula non funziona perch Excel interpreta le parentesi graffe come testo e non possibile eseguire calcoli sul testo. Assicurarsi quindi di premere CTRL+SHIFT+ENTER. Bene! Forse siamo tutti un po storditi da questa tediosa investigazione di Excel, ma credo ne sia valsa la pena, se non altro per aver chiarito uno degli scogli pi duri delle funzioni statistiche di Excel. Anche la prossima puntata sar complicata, ma come sempre, cercheremo di analizzare i dettagli con calma e semplicit. Alla fine saremo sicuramente riusciti a chiudere il cerchio delle 7 funzioni principali come in questo schema: Non mancate allappuntamento su www.francescocaranti.net . Francesco Caranti

PREVISIONE PEARSON

REGR.LIN

TENDENZA

ERR.STD.YX

PENDENZA

RQ

FUNZIONI

EXCEL

82

Opzioni in laboratorio 32 Minimi quadrati in Excel Nei contributi 18, 19 e 20 abbiamo parlato a lungo della Regressione Lineare e gi la volta scorsa siamo tornati sullargomento. Approfittando di un esempio fantasioso di un ipotetico lago inquinato a Topolinia, abbiamo verificato che esistono due funzioni Excel che producono gli stessi risultati: PREVISIONE e TENDENZA e ci che gi sappiamo che il meccanismo di calcolo si basa sul metodo dei minimi quadrati di Gauss. La Regressione Lineare una retta, anzi la miglior retta, in grado di passare nel modo ottimale tra i punti sperimentali di osservazione. Una retta del genere si definisce interpolante. Ovviamente lutilizzo dellinterpolante sar quello di andare oltre il campo di osservazione, estrapolando cio le previsioni che ci servono. Dovete sapere che dalle mie parti esiste la vecchia Ferrarese cio una strada che congiunge Ferrara a Bologna. Ebbene, la Ferrarese un esempio che oggi cade a fagiolo perch qui da noi per dire che un certo tragitto tortuoso e comunque poco lineare, si dice che come la Ferrarese. Una ragione c: quando tracciarono quella strada si trovarono a fare i conti con mezzadri, contadini, latifondisti e proprietari terrieri i quali si rifiutarono categoricamente di farsi espropriare le terre, i casali e le corti, cosicch gli ingegneri di allora furono costretti a raggirare quelle propriet fino a creare una strada dal tipico andamento sinuoso fatto di curve e di bisce. Ben diversamente sarebbe andata se ai costruttori fosse stato concesso di abbattere quei possedimenti e costruire una interpolante snella e rettilinea. Ecco il nesso: la Ferrarese linsieme dei punti delle nostre osservazioni sperimentali (le cascine e i casali) mentre la Regressione Lineare quellipotetica strada maestra che compie il miglior tragitto possibile, cio quello rettilineo. Tornado a ci che ci interessa maggiormente, sulla Regressione Lineare applicata alla Borsa abbiamo parlato bene ma anche meno bene: pregi e difetti di tutti gli Indicatori. In senso positivo, della Regressione Lineare abbiamo speso buone parole definendola molto potente e molto veloce, di contro occorre saperla interpretare poich tende ad essere un po instabile e come tale dovr essere supportata da altre indicazioni, come vedremo pi avanti in questa rubrica. Nota: Perch, direte voi, tornare ancora sulla Regressione Lineare? Non bastava sapere che esiste e che gode di certe propriet? Perch non fermarsi qui? La risposta molto semplice: la regressione lineare uno dei capisaldi della Statistica Descrittiva e se anche non fosse proprio questa regressione lineare a fornirci i risultati migliori in Borsa, ci non importa perch quel che veramente conta limpostazione e la metodologia delle regole e dei principi della statistica. Voglio dire, per esempio, che finch non riuscir a interiorizzare i minimi quadrati di Gauss, la mia confidenza coi numeri sar ancora scarsa e difficilmente riuscir a fare qualche previsione sensata. Riguardo al metodo dei minimi quadrati, nel contributo 19 ce la siamo cavata con poco sforzo dato che siamo arrivati ai risultati tramite il metodo di sostituzione che, per quanto elementare, comunque complesso e rudimentale. Quel che vedremo oggi invece la soluzione classica attraverso il metodo ufficiale di Gauss, il tutto applicato alla Borsa a suon di celle e a suon di formule.

83

Via! Si parte! Si comincia col copia-incolla del contributo Opzioni in laboratorio 20 LRI in Excel. Il dominio 14 e il 19 gennaio Excel restituisce il valore 15201,83 a fronte di una chiusura a 15651. Il nostro obiettivo la verifica di 15201,83 partendo dalla formula. Iniziamo con questa tabella della simbologia e delle formule:

K1 = 14 INDICATORE LRILINEAR

REGRESSION

INDICATOR

LRI X -Nota

Data Aper Max Min Ch Vol (K1)

02/01/12 15096 15456 15092 15454 726255 1

03/01/12 15534 15675 15465 15645 1387748 2

04/01/12 15612 15632 15287 15327 1356383 3

05/01/12 15348 15377 14715 14767 1705882 4

06/01/12 14801 15024 14566 14645 1600782 5

09/01/12 14694 14742 14370 14401 1499594 6

10/01/12 14541 14905 14521 14844 1844427 7

11/01/12 14832 15010 14745 14882 1670052 8

12/01/12 14951 15401 14937 15192 2287962 9

13/01/12 15382 15429 14825 15011 2058296 10

16/01/12 14888 15247 14814 15220 1565901 11

17/01/12 15409 15505 15212 15325 1942558 12

18/01/12 15328 15476 15132 15278 1704783 13

19/01/12 15353 15654 15244 15651 2915312 15201,83 14

20/01/12 15637 15758 15529 15632 2561503 15382,29 15

23/01/12 15632 15957 15594 15907 2471956 15655,66 16

24/01/12 15828 15929 15683 15929 2144221 15881,77 17

25/01/12 16020 16078 15708 15840 2378453 15987,80 18

26/01/12 15946 16192 15850 16111 2483425 16115,43 19

27/01/12 16040 16183 15911 15946 2044607 16123,89 20

30/01/12 15836 15963 15624 15753 1739722 16101,86 21

31/01/12 15943 16059 15827 15828 2367417 16078,57 22

01/02/12 15842 16310 15832 16264 2988644 16184,66 23

02/02/12 16344 16382 16129 16276 2346918 16237,34 24

sommatoria degli X

X al quadrato

quadrato della sommatoria degli X

sommatoria dei quadrati di X

Equazione di una retta: Y = a + bX

in cui:

'a' l'ordinata all'origine (o 'intercetta')

'b' il coefficiente angolare

Per la Retta di Regressione Lineare si ha:

a =

SIMBOLOGIA

x

x2

(x)2

x2

84

Nota: La lettera Sigma maiuscola rappresenta una Sommatoria. Attenzione a non confondere (x)2 con x2 : questo esempio dei primi 14 valori di X pu chiarire.

Nota: Nella dispensa 19 avevamo gi accennato allequazione della retta. Riporto uno stralcio: la volta scorsa abbiamo detto che a fronte di un esperimento di osservazioni di coppie di valori campione (il tempo e la velocit di una biglia) possibile tracciare una retta che rappresenta la soluzione approssimata migliore. Poich qualsiasi retta del piano rappresentata sempre da una equazione del tipo Y=a+bX, il compito di oggi sar quello di calcolare a e b tramite il metodo scoperto da Gauss / Laplace a fine 700 . In realt in quel contributo avevamo risolto il problema solo empiricamente, cio mettendo a Sistema una serie di informazioni di tempo e velocit della biglia. Eravamo poi arrivati alla soluzione tramite il metodo di sostituzione o attraverso la matrice di Cramer. Questa volta diverso perch non partiamo pi dai dati sperimentali per trovare lequazione ma ci arriviamo direttamente dallenunciato di Gauss, cio dalle due formule riportate al termine della tabella Simbologia. Concludendo, pare proprio che io debba trovare i due termini:

a b

perch a quel punto baster sostituirli in Y=a+bX e il gioco sar fatto !!! Come al solito partiamo dalla fine e controlliamo il copia-incolla delle colonne U,V,W dellExcel allegato:

1 1 1 1 1

2 3 4 9 5

3 6 9 36 14

4 10 16 100 30

5 15 25 225 55

6 21 36 441 91

7 28 49 784 140

8 36 64 1296 204

9 45 81 2025 285

10 55 100 3025 385

11 66 121 4356 506

12 78 144 6084 650

13 91 169 8281 819

14 105 196 11025 1015

x2 (x)2 x x2 x

Col U Col V Col W

=a+bx

b a Linear

coeff.ang. ord.origine Regr

13,0066 15019,736 15201,83

85

In colonna U c il coefficiente angolare b = 13,0066, in colonna V lordinata allorigine a Poich il nostro esempio si riferisce alla regressione lineare del FTSEMIB a 14 giorni, operando la sostituzione si ottiene:

= 15019 + (13,0066 x 14) = 15201,83 Perfetto: abbiamo capito! Limportante trovare a e b , dopodich la retta perfettamente individuata. Ora per andiamo con ordine, partendo dallinizio del nostro foglio Excel (i copia-incolla che vediamo sono forzatamente divisi in blocchi per motivi di spazio). Le prime 7 colonne (fino a G) sono le stesse della dispensa 20 e calcolano la regressione lineare tramite la formula =PREVISIONE. Vi ricordo che il dominio 14. Le colonne da H a L sono state spiegate nella Nota. Il nostro compito resta quello di ritrovare il valore 15201,83 senza usare =PREVISIONE ma tramite i passaggi successivi dellequazione di Gauss. Ora scopriamo le colonne da M a R la cui intestazione dovrebbe essere chiara. Vi ricordo che X il tempo e Y le chiusure di Borsa.

K1 = 14

Col A Col B Col C Col D Col E Col F Col G Col H Col I Col J Col K Col L

=PREVISIONE

LRI

Data Aper Max Min Chius Vol (K1)

02/01/12 15096 15456 15092 15454 726255 1 1 1 1 1

03/01/12 15534 15675 15465 15645 1387748 2 3 4 9 5

04/01/12 15612 15632 15287 15327 1356383 3 6 9 36 14

05/01/12 15348 15377 14715 14767 1705882 4 10 16 100 30

06/01/12 14801 15024 14566 14645 1600782 5 15 25 225 55

09/01/12 14694 14742 14370 14401 1499594 6 21 36 441 91

10/01/12 14541 14905 14521 14844 1844427 7 28 49 784 140

11/01/12 14832 15010 14745 14882 1670052 8 36 64 1296 204

12/01/12 14951 15401 14937 15192 2287962 9 45 81 2025 285

13/01/12 15382 15429 14825 15011 2058296 10 55 100 3025 385

16/01/12 14888 15247 14814 15220 1565901 11 66 121 4356 506

17/01/12 15409 15505 15212 15325 1942558 12 78 144 6084 650

18/01/12 15328 15476 15132 15278 1704783 13 91 169 8281 819

19/01/12 15353 15654 15244 15651 2915312 15201,83 14 105 196 11025 1015

x2 (x)2 x x2 x y

Col M Col N Col O Col P Col Q Col R

15454 238826116 238826116 238826116 15454 15454

31099 244766025 967147801 483592141 31290 46744

46426 234916929 2155373476 718509070 45981 92725

61193 218064289 3744583249 936573359 59068 151793

75838 214476025 5751402244 1151049384 73225 225018

90239 207388801 8143077121 1358438185 86406 311424

105083 220344336 11042436889 1578782521 103908 415332

119965 221473924 14391601225 1800256445 119056 534388

135157 230796864 18267414649 2031053309 136728 671116

150168 225330121 22550428224 2256383430 150110 821226

165388 231648400 27353190544 2488031830 167420 988646

180713 234855625 32657188369 2722887455 183900 1172546

195991 233417284 38412472081 2956304739 198614 1371160

211642 244953801 44792336164 3201258540 219114 1590274

y2 (y)2

y xy y2

xy

86

E infine vediamo le colonne da S a X: Tutto quadra: in colonna W ricompare 15201,83 e per sicurezza abbiamo inserito la colonna X che riporta il risultato ottenuto con la formula =TENDENZA anzich =PREVISIONE di colonna G. Mi fermo qui per non appesantire. La prossima volta concluderemo lo studio tramite lestensione di questo foglio Excel per vedere il collegamento con le altre funzioni statistiche: Appuntamento sempre qui, su www.francescocaranti.net Francesco Caranti

Col S Col T Col U Col V Col W Col X

=a+bx =TENDENZA

b b b a Linear Tendenza

numerat denominat coeff.ang. ord.origine Regr

41426 3185 13,0066 15019,736 15201,83 15201,83

=PREVISIONE

=TENDENZA

=PENDENZA

=RQ

=ERR.STD.YX

=REGR.LIN

=PEARSON

E X C E L

87

Opzioni in laboratorio 33 Angolo e pendenza della Regressione Lineare in Excel La biglia, il lago inquinato di Topolinia e il decorso della via ferrarese ci hanno aiutati a individuare quella via maestra che meglio rappresenta il trend di un gruppo di osservazioni sperimentali. La via maestra linterpolante: magari conoscessimo quella della Borsa! O meglio, la si pu anche individuare ma ancora una volta si presenta il problema della coperta corta pi volte discusso. Mi spiego meglio: per andare da Bologna a Ferrara con la vecchia strada, a suon di curve e di sterzate, si passa per C de Fabbri, Lovoleto, Minerbio e Malalbergo mentre lautostrada che le corre parallela (ecco linterpolante) fa: Bentivoglio, Interporto, Altedo per poi arrivare sparata a Ferrara sud. Se ora prendiamo la carta dellEmilia, vediamo che lautostrada ha uninclinazione media di 73 nord mentre la vecchia ferrarese oscilla alternativamente tra 60 a 84 proprio perch si disperde continuamente a zig zag. Il nesso dovrebbe essere chiaro: ammesso che lautostrada sia il trend di Borsa dominante e che quindi io sia entrato long su una call, nella vita reale la Borsa purtroppo una Ferrarese e poco mi importa at now che quellautostrada arrivi davvero a Ferrara perch quando a Malalbergo la strada rientra a nord-est, sai la mia povera call quanto si deprezzata? Si parla tanto di cavalcare il trend ma oggi le sterzate sono pi che mai allordine del giorno. Bando allo sconforto, il concetto fin qui visto della Regressione Lineare a dir poco eccellente perch, volere o volare, a Ferrara ci si arriva di sicuro: quel che importa capire quale sia la mezzeria dellIndice perch a quel punto qualche Deviazione Standard di Chebyshev, o piuttosto una Linea Verde prima o poi mi verranno incontro per piazzare al meglio i miei ordini a mercato. Nel contributo 20 abbiamo fatto un passo molto importante: riprendo il testo di allora: ci siamo accorti che la regressione lineare non si pu applicare a qualsiasi processo statistico ma solo a quelli che rispondono alla linearit, attributo, questultimo, che non fa certo parte della Borsa che per sua natura un moto browniano. Sconfortati da queste osservazioni, ci siamo lasciati, affermando per che esiste una soluzione di conciliazione che permette di rendere lineare ci che lineare non . Il concetto quello dellastrazione per punti e vediamo subito di cosa si tratta. Se facciamo un passo indietro e ripensiamo a ci che pi facile da comprendere ci accorgiamo che nonostante laltalena browniana delle Borse, il metodo di scartare ogni giorno allindietro in modo FIFO ha un certo significato. Se dunque applichiamo il metodo FIFO delle medie mobili anche alla nostra regressione lineare, potremo - per cos dire - trasformare un processo non lineare in un processo lineare . Dunque il FIFO applicato alla regressione lineare supera, per cos dire, il problema della linearit/non linearit: ottimo! Ma torniamo ancora un attimo allinclinazione della Ferrarese: abbiamo parlato di 60 e di 84. Che cosa sono questi gradi? Ma certo! Sono gli angoli della nostra trendline di Borsa. A questo punto dobbiamo tornare a quanto dicevamo sulla regressione lineare, che in quanto retta ha la sua brava equazione del tipo y=a+bx sulla quale abbiamo lavorato parecchio la volta scorsa per spiegare la soluzione dei minimi quadrati.

88

Ricordate questo copia-incolla? La Linear Regression Trendline al 19 gennaio 2012 (con dominio 14) era 15201,83 e si otteneva cos:

a (15019,74) + b (13,0066) moltiplicato X (14 osservazioni) = 15201,83 Ma, visto che stavamo parlando di geografia e di inclinazioni in gradi, la nostra pendenza b che cosa realmente? Non mi pare che siano gradi! E solo un numero, qui di gradi non si vede neanche lombra. Gi: il coefficiente angolare in geometria non un valore espresso in angolo ma rappresenta la tangente tra la retta e lasse X. Tanto per stemperare un po largomento che rischia di diventare pesante, vediamo i casi trigonometrici pi facili:

y=a+bx a angolo b a b angolo

(coef-ang) (pendenza) (pendenza) (coef-ang)

( A ) 0 45 1,00000 0 1,00000 45

a=0

angolo 45

pendenza 'b'=1

b=TAN(RADIANTI(angolo)) angolo=GRADI(ARCTAN(pendenza))

( B )

0 30 0,57735 0 0,57735 30

a=0

angolo 30

pendenza 'b'=0,57735 b=TAN(RADIANTI(angolo)) angolo=GRADI(ARCTAN(pendenza))

( C )

a=0 0 60 1,73205 0 1,73205 60

angolo 60

pendenza 'b'=1,73205

=a+bx =TENDENZA

b b b a Linear Tendenza

numerat denominat coeff.ang. ord.origine Regression

(pendenza) (intercetta) Trendline

41426 3185 13,0066 15019,74 15201,83 15201,83

89

Ho scelto i tre esempi pi semplici possibile: tre rette inclinate di 45, 30 e 60 sullasse X. Ho inoltre imposto che l ordinata allorigine sia sempre a zero, cio ho posto a=0. E questo lo si capisce bene: se guardate con attenzione i tre diagrammi, vedrete che le tre rette partono tutte dallorigine 0,0 (magari il disegno non perfetto, ma il concetto questo. Per ogni caso A) B) e C) ho calcolato lequivalente tra langolo e il coefficiente angolare (pendenza).

nel primo caso in azzurro, langolo 45 e la pendenza 1 nel secondo caso in verde, langolo 30 e la pendenza 0,57735 nel primo caso in viola, langolo 60 e la pendenza 1,73205

Come al solito Excel ad aiutarci in merito alla conversione: gradi/pendenza e viceversa pendenza/gradi. Le funzioni sono:

=GRADI(ARCTAN(pendenza)) per trovare langolo partendo dalla pendenza =TAN(RADIANTI(angolo)) per trovare la pendenza partendo dallangolo

Vi lascio il foglio Excel se vorrete fare qualche prova. Quello che si pu subito notare che langolo cresce proporzionalmente alla pendenza, e questo intuitivo ma in matematica sempre bene far notare le cose. E ci che pu veramente stupire il valore altissimo della pendenza del nostro caso reale: il 19 gennaio la retta di regressione aveva una pendenza di 13,0066, un valore enorme se lo mettiamo a confronto con quello pi alto del nostro esempio (1,73205 per 60). Curiosi come sempre, calcoliamo subito langolo della regressione lineare al 19 gennaio: applicando: =GRADI(ARCTAN(13,0066)) otteniamo un angolo di circa 86. Ci rivediamo presto; per il momento vi lascio lexcel dellesercitazione di oggi. La prossima volta proseguiremo a legare fra loro le varie funzioni PREVISIONE, TENDENZA, PENDENZA in uno stesso foglio. Per dubbi, domande e quantaltro io resto sempre qua. Vi attendo su www.francescocaranti.net Francesco Caranti

90

Opzioni in laboratorio 34 Visualizzare la Regressione Lineare in Excel A tutti noi che seguiamo la Borsa e il suo grafico giorno dopo giorno, interessa molto renderci conto dellinclinazione del trend perch proprio in base a questa informazione che si riesce ad impostare la maggior parte delle strategie. Ecco allora che uninclinazione orizzontale (parallela alla x) evidenzia un movimento laterale mentre le pendenze in salita o in discesa ci suggeriscono di impostare un portafoglio rialzista o ribassista. Posto che indovinare la tendenza il compito pi difficile dellanalista perch quello specifico trend in atto pu interrompersi da un momento allaltro, vediamo subito come si possa visualizzare il comportamento della regressione sul grafico. Poich nella regressione sono in gioco molti dati, per evitare di entrare in confusione vi suggerisco di seguire i passaggi con carta e penna, o meglio ancora con un foglio Excel. Partiamo dai dati della volta scorsa, fissando come data di riferimento il primo giorno della serie: 19 gennaio 2012:

Chiusura 15651 Dominio della regressione 14 Pendenza 13,0066 Intercetta 15019,74

K1 = 14

FOGLIO 'A'

Col A Col B Col C Col D Col E Col F Col G Col H Col U Col V

=PREVISIONE

LRI b a

Data Aper Max Min Chius Vol (K1) coeff.ang. ord.origine

02/01/12 15096 15456 15092 15454 726255 1 (pendenza) (intercetta)

03/01/12 15534 15675 15465 15645 1387748 2

04/01/12 15612 15632 15287 15327 1356383 3

05/01/12 15348 15377 14715 14767 1705882 4

06/01/12 14801 15024 14566 14645 1600782 5

09/01/12 14694 14742 14370 14401 1499594 6

10/01/12 14541 14905 14521 14844 1844427 7

11/01/12 14832 15010 14745 14882 1670052 8

12/01/12 14951 15401 14937 15192 2287962 9

13/01/12 15382 15429 14825 15011 2058296 10

16/01/12 14888 15247 14814 15220 1565901 11

17/01/12 15409 15505 15212 15325 1942558 12

18/01/12 15328 15476 15132 15278 1704783 13

19/01/12 15353 15654 15244 15651 2915312 15201,83 14 13,0066 15019,74

x y

91

Ora chiediamo a Excel di visualizzare la regressione lineare. Per far ci selezioniamo le chiusure dei 14 periodi (dal 2 al 19 gennaio) e schiacciamo F11: Excel crea automaticamente il grafico delle ultime 14 chiusure. Andiamo in tipo di grafico e selezioniamo dispersione. Ci fatto ci posizioniamo su un punto qualsiasi della serie (per esempio il 19 gennaio) e facciamo click destro col mouse. Scegliamo Aggiungi linea di tendenza e Visualizza lequazione sul grafico: Dopo aver aggiustato i colori e la scritta dellintestazione, otteniamo la tanto sospirata Regressione, cio linterpolante (Ferrarese). Come potete notare, Excel ha visualizzato automaticamente lequazione sul grafico, cio y=13,007x + 15020 che combina perfettamente coi nostri risultati. I punti di dispersione sono 14 e la retta inclinata (a occhio) di circa 10 gradi.

Regressione lineare a 14 periodi del 19 gennaio

y = 13,007x + 15020

14200

14400

14600

14800

15000

15200

15400

15600

15800

0 2 4 6 8 10 12 14 16

92

In pratica, con le ultime 14 osservazioni dal 2 al 19 gennaio, la regressione lineare ci informa che il trend al 19 gennaio era lateral-rialzista (molto laterale e poco rialzista). A questo punto fondamentale comprendere bene il MOVIMENTO della regressione lineare al passare dei giorni perch molto facile confondersi. Per fare ci, utilizziamo uno strumento diverso da Excel, cio Metastock che per queste cose ha decisamente una marcia in pi. Per questo esempio, abbandoniamo il 19 gennaio e passiamo ai due ultimi giorni della nostra osservazione, rispettivamente l11 e 12 giugno: capiremo molto presto quale sia linterpretazione da dare. Chiediamo a Metastock di visualizzare la regressione lineare a 14 periodi del 12 giugno e di restituire anche langolo di inclinazione del grafico. Metastock risponde: inclinazione di circa 7 (periodo 24 maggio / 12 giugno pari a 14 osservazioni). Poi arretriamo di un giorno: dal 12 all11 giugno ottenendo il secondo grafico bordato in rosso. Come potete osservare, Metastock ha eseguito in FIFO, cio dal precedente periodo 24 maggio / 12 giugno passato a 23 maggio / 11 giugno rispettando il dominio prescelto di 14 sedute. Vediamo:

2April

10 16 23 30May

7 14 21 28 4June

11 18 2512300124001250012600127001280012900130001310013200133001340013500136001370013800139001400014100142001430014400145001460014700148001490015000151001520015300154001550015600157001580015900

12300124001250012600127001280012900130001310013200133001340013500136001370013800139001400014100142001430014400145001460014700148001490015000151001520015300154001550015600157001580015900

Inclinazione 7 gradi circa

FTSEMI20120518

2April

10 16 23 30May

7 14 21 28 4June

11 18 2512300124001250012600127001280012900130001310013200133001340013500136001370013800139001400014100142001430014400145001460014700148001490015000151001520015300154001550015600157001580015900

12300124001250012600127001280012900130001310013200133001340013500136001370013800139001400014100142001430014400145001460014700148001490015000151001520015300154001550015600157001580015900

Giorno precedente: 11 giugnoInclinazione di 11 gradi circa

FTSEMI20120518

93

Nota: le barre verticali in blu sona la tenaglia del periodo (14 sedute). Ogniqualvolta si arretra, anche la tenaglia arretra e la regressione lineare in rosso cambia langolo. Perfetto: la regressione ha modificato la pendenza precedente passando da 7 a 11 gradi. Nota: per fini didattici, il mio esempio andato allindietro nel tempo. E chiaro che lanalista dovr fare lesatto opposto, cio prendere nota del cambiamento di pendenza in avanti, cio giorno dopo giorno. Pertanto, nel nostro caso, linclinazione della linea rossa passa da 11 a 7 gradi indicando un andamento tendenziale al ribasso. Una volta compreso il concetto di regressione = angolo della pendenza pu essere interessante vedere graficamente la relazione tra:

Regressione Lineare in quanto pendenza della retta (linear regression trendline) Regressione Lineare in quanto insieme dei punti giornalieri sul grafico (linear regression

indicator) La differenza sostanziale e per capirlo torniamo al 12 giugno 2012 con questo grafico:

In rosso la trendline In marrone lindicator

La prima cosa da notare che il 12 giugno la trendline e lindicator (rosso e marrone) coincidono sullo stesso valore 13191,91 ed giusto che sia cos perch la linea rossa parte da quel punto e arretra di 14 periodi indicando linclinazione, mentre la linea marrone ci mostra il valore di quel giorno. Se invece buttiamo locchio un po pi indietro, i valori non combinano pi perch gi il giorno precedente la curva marrone era pi in alto. Nota: per non confondere la trendline con lindicator della Regressione lineare pu essere utile ricordare che mentre la trendline si riferisce allultima osservazione plottata (12 giugno), lindicator mostra il valore della regressione giorno dopo giorno. Tutto questa congettura per arrivare a una semplice conclusione che il grafico ci aiuta a comprendere, una conclusione fondamentale per la Regressione Lineare:

Nella Regressione Lineare, nonostante lIndicator (marrone) possa scendere, la corrispondente Trendline (rossa) pu ancora continuare a salire

19 26 2April

10 16 23 30May

7 14 21 28 4June

11 18 25

12500

13000

13500

14000

14500

15000

15500

16000

16500

17000

12500

13000

13500

14000

14500

15000

15500

16000

16500

17000FTSEMI20120518, Linear Regression Indicator

94

Da tutto ci avrete capito come sia fondamentale il fatto di vedere lo stesso problema sotto angolazioni diverse tanto che nello specifico della regressione lineare ci siamo accorti come lo stesso strumento statistico sia in grado di offrire visioni di interpretazione completamente diverse. Ma siccome a noi, oltre che a divagare in matematica e dintorni, piace essere fondamentalmente pratici, credo sia giusto affermare che questa Regressione Lineare meriti un posto di grande rispetto nella tabella degli Indicatori visti finora. Per questo, direi di riprenderla in mano per aggiornarla cos: In blu, dopo la riga delle dispense 18, 19 e 20 abbiamo aggiunto le ultime dispense 31,32,33 e 34 che sono ritornate sullargomento Regressione Lineare con laggiunta della Trendline oltre che il precedente Indicator. Il commento: Da abbinare al Linear Regression Indicator ci lascia intendere che lanalista di Borsa dovr porre attenzione allaccoppiata dei suggerimenti di entrambi i risultati (Indicator e Trendline) e non di uno soltanto. Vi lascio ai vostri studi: lExcel allegato pu aiutare a comprendere la soluzione. Attendo i vostri commenti su www.francescocaranti.net Francesco Caranti

Dispensa Indicatore Param. Volumi Giudizio

12-13 Aroon 14 no Per trend veloci

14 RSI 14 no Controlla gli eccessi

15 MACD 12-26 no Solo 'popolare'

16 DEMA - TEMA 21 no Buoni in molte circostanze

17 Chaikin A/D 3-10 si Attenzione a interpretarlo

18-19-20 Linear Regression Indicator 14 no Molto potente - molto veloce

31-32-33-34 Linear Regression Trendline 14 no Da abbinare al Linear Regression Indicator

21-22-23 Deviazione Std 14 no Non tradabile - misura gli eccessi - migliorabile

24 Bande di Bollinger 20 no No comment 29-30 Ultimate 7,14,28 no Controlla bene gli eccessi - regola un po cabalistica

Questi, invece, gli Indicatori/Indici proprietari:

25 Linea Verde Caranti nessuno no Baricentro - Base di Chebyshev

27-28 Perc. D.S. Caranti 14/20 no Deriva da D.S. - misura gli eccessi - collaudato

95

Opzioni in laboratorio 35 Collegamenti tra funzioni Excel Al punto in cui ci troviamo in questo Corso, non sarebbe male evidenziare le origini, o meglio, le famiglie degli Indicatori di Borsa. Stilare una classificazione, per quanto ufficiosa, fondamentale per capire i legami esistenti/non esistenti tra un Indicatore e laltro. Lo dico perch, per esempio, se un domani ci trovassimo ad avere a che fare con Aroon che si basa sui minimi e i massimi, capiremmo al volo che non stiamo usando funzioni Excel di tipo statistico (es: TENDENZA), ma solo semplici combinazioni (algoritmi) dei dati di Borsa basilari (open high low close volume). Considerando i soli Indicatori visti finora, le famiglie sono:

A) Indicatori algoritmici (Medie Mobili, Aroon, RSI, MACD, Dema, Tema, Chaikin, Ultimate) B) Indicatori statistici (Linear regression indicator, Linear regression trendline, Standard

deviation, Perc.D.S.Caranti) C) Indicatori misti (Bande di Bollinger, Linea Verde Caranti)

Porsi a priori la domanda se sia pi affidabile un indicatore di una famiglia o di unaltra inopportuno perch solo dalla sintesi di pi di una ipotesi che scaturisce la decisione operativa finale. La classificazione in famiglie ci permette di instradare per i nostri ragionamenti verso un range di congetture specifiche, nientaltro. Gli Indicatori della famiglia B a loro volta si possono classificare a seconda della presenza/non-presenza di relazioni tra le funzioni statistiche. Tanto per fare un esempio, mentre la funzione =DEV.ST.POP non presenta legami con nessunaltra funzione, le formule =PREVISIONE e =TENDENZA sono collegabili tramite il metodo dei minimi quadrati di Gauss. Vediamo la riclassificazione: B) Indicatori statistici:

B1) Indicatori statistici non collegati da funzioni Excel: Deviazione Standard. In Excel =DEV.ST.POP (introdotta da Karl Pearson a fine 800)

B2) Indicatori statistici collegati da funzioni Excel (introdotta da Gauss): Regressione Lineare. In Excel =PREVISIONE

Regressione Lineare. In Excel =TENDENZA Regressione Lineare. In Excel =PENDENZA

Regressione Lineare. In Excel =INTERCETTA Regressione Lineare. In Excel =RQ Regressione Lineare. In Excel =ERR.STD.YX Regressione Lineare. In Excel =REGR.LIN Regressione Lineare. In Excel =PEARSON Regressione Lineare. In Excel =CORRELAZIONE

Lo schema B2 che vedete pi sotto dovrebbe chiarire. Nota: Il segno di spunta evidenzia che largomento gi stato trattato.

96

Nota per i programmatori: LExcel in allegato riporta le formule in chiaro di ciascun Indicatore alla data del 19 gennaio 2012, linizio del nostro laboratorio. Ritengo inopportuno soffermarmi su ciascuna formula ma gli appassionati possono verificare i calcoli. Mi preme soltanto mostrare questo schema di collegamento e relazione tra le funzioni, molto utile per sintetizzare: Prima di procedere e tanto per stemperare largomento che si presta a diventare macchinoso, proviamo a capire che cosa in realt stiamo facendo. La risposta semplice: stiamo facendo la quadra come spesso si fa quando si introducono concetti nuovi in matematica. Lesempio potrebbe essere quello della trigonometria. Che cosa successe nel caso della trigonometria? Semplice! Partendo dalla storia, pare che circa 200 anni prima di Cristo, allastronomo Ipparco di Nicea, venisse in mente di sviluppare dei modelli che spiegassero il movimento del Sole e della Luna e fu cos che si imbatt nella misura degli angoli, in particolare degli angoli del triangolo. Da qui nacque la trigonometria che in greco significa appunto studio dei triangoli (trigonon metron). Fu cos che, pian piano nel tempo, si pens di rapportare i cateti del triangolo tra loro, e allora qualcuno invent il seno e il coseno. Da l si sbizzarrirono e con la logica che lappetito vien mangiando si pass alla tangente e alla cotangente, allarcoseno e allarcocoseno e via dicendo Insomma: da un semplice triangolo sono nate pi di 10 funzioni trigonometriche. Lo stesso vale per noi: dalla pendenza e dallintercetta siamo arrivati alla regressione lineare di Gauss e da l in poi, tramite calcoli diversi, siamo approdati a tanti altri Indicatori raccordati tra loro. Chiusa la parentesi storica, apriamo le danze e corriamo a scoprire le colonne Excel rimaste nascoste nelle puntate precedenti. Per motivi di spazio divideremo in parti (potete aprire lExcel FoglioA).

PREVISIONE CORRELAZIONE

TENDENZA PEARSON

PENDENZA

(SLOPE) REGR.LIN

INTERCETTA RQ ERR.STD.YX

FUNZIONI

STATISTICHE

EXCEL

COLLEGATE

Relazioni:

PREVISIONE = TENDENZA = (Equazione y=a+bx)

REGR.LIN = PENDENZA = (Coefficiente angolare)

INTERCETTA = (Ordinata all'origine)

RQ = (R-quadrato = Coefficiente di Determinazione)

PEARSON = CORRELAZIONE (Elevando al quadrato si ottiene RQ)

ERR.STD.YX = (Standard Error)

ARCTAN = (Trasforma coeffic angolare in gradi)

97

Colonne A / L: calcoli preliminari e funzione PREVISIONE Colonne M / X: calcolo manuale di Linear Regression Trendline (col. W) a confronto con Excel TENDENZA (col. X) Colonne Y / AD: calcolo di R-QUADRATO E ERR.STD.YX

Col M Col N Col O Col P Col Q Col R Col S Col T Col U Col V Col W Col X

=a+bx =TENDENZA

b b b a Linear Tendenza

num denom coeff.ang. ord.origine Regression

15454 238826116 238826116 238826116 15454 15454 (pendenza) (intercetta) Trendline

31099 244766025 967147801 483592141 31290 46744

46426 234916929 2155373476 718509070 45981 92725

61193 218064289 3744583249 936573359 59068 151793

75838 214476025 5751402244 1151049384 73225 225018

90239 207388801 8143077121 1358438185 86406 311424

105083 220344336 11042436889 1578782521 103908 415332

119965 221473924 14391601225 1800256445 119056 534388

135157 230796864 18267414649 2031053309 136728 671116

150168 225330121 22550428224 2256383430 150110 821226

165388 231648400 27353190544 2488031830 167420 988646

180713 234855625 32657188369 2722887455 183900 1172546

195991 233417284 38412472081 2956304739 198614 1371160

211642 244953801 44792336164 3201258540 219114 1590274 41426 3185 13,0066 15019,74 15201,83 15201,83

y2 (y)2

y xy y2

xy

Col A Col B Col C Col D Col E Col F Col G Col H Col I Col J Col K Col L

=PREVISIONE

LRI

Data Aper Max Min Chius Vol (K1)

02/01/12 15096 15456 15092 15454 726255 1 1 1 1 1

03/01/12 15534 15675 15465 15645 1387748 2 3 4 9 5

04/01/12 15612 15632 15287 15327 1356383 3 6 9 36 14

05/01/12 15348 15377 14715 14767 1705882 4 10 16 100 30

06/01/12 14801 15024 14566 14645 1600782 5 15 25 225 55

09/01/12 14694 14742 14370 14401 1499594 6 21 36 441 91

10/01/12 14541 14905 14521 14844 1844427 7 28 49 784 140

11/01/12 14832 15010 14745 14882 1670052 8 36 64 1296 204

12/01/12 14951 15401 14937 15192 2287962 9 45 81 2025 285

13/01/12 15382 15429 14825 15011 2058296 10 55 100 3025 385

16/01/12 14888 15247 14814 15220 1565901 11 66 121 4356 506

17/01/12 15409 15505 15212 15325 1942558 12 78 144 6084 650

18/01/12 15328 15476 15132 15278 1704783 13 91 169 8281 819

19/01/12 15353 15654 15244 15651 2915312 15201,83 14 105 196 11025 1015

x2 (x)2 x x2 x y

Col Y Col Z Col AA Col AB Col AC Col AD

=RQ =ERR.STD.YX

R-quadrato R-quadrato R-quadrato R-quadrato standard standard

numerat denominat error error

8755681 410855185 0,0213 0,0213 383,7827 383,7827

98

Colonne AE / AJ: funzioni REGRLIN, PENDENZA, INTERCETTA, PEARSON, CORRELAZIONE e ARCO-TANGENTE : Per oggi ci fermiamo qui: vi unisco lExcel di esercitazione. Oltre allExcel FoglioA che si riferisce al solo 19 gennaio e al dominio fisso 14 , troverete il FoglioB con dominio e data variabile per lintero periodo: 19 gennaio / 12 giugno. Nel FoglioB sono stati eliminati i passaggi intermedi dei calcoli usando la formula diretta. La prossima volta la nostra fatica sar ricompensata perch tramite i collegamenti visti oggi sar molto pi facile capire largomento RQ e SLOPE cos come ce lo propone la letteratura ufficiale. A presto, sempre su www.francescocarnti.net . Francesco Caranti

Col AE Col AF Col AG Col AH Col AI Col AJ

=REGR.LIN =PENDENZA =INTERCETTA =PEARSON =CORRELAZIONE =ARCTAN

b b a Gradi del

coeff.ang. coeff.ang. ord.origine coeff.ang.

(pendenza) (pendenza) (intercetta) b

13,0066 13,0066 15019,74 0,1460 0,1460 86

99

Opzioni in laboratorio 36 RQ e SLOPE in Excel La volta scorsa abbiamo cominciato a vedere come sia possibile raccordare tra loro le funzioni statistiche di Excel che hanno un impatto diretto sugli Indicatori di Borsa. Ricordo che lobiettivo dei nostri studi la scelta del miglior Indicatore, obiettivo che cerchiamo di perseguire nellunico modo possibile, cio attraverso lindagine numerica e statistica delle serie storiche tramite Excel. Apro una parentesi per evidenziare che gi a questo punto del Corso siamo riusciti a stilare una graduatoria di preferenze, sovvertendo pi volte lopinione comune. Tanto per fare un esempio abbiamo dimostrato che il tanto elogiato MACD pu tranquillamente andare in cantina mentre la meno conosciuta Regressione Lineare risultata uno strumento statistico di enorme potenzialit. Tutto ci per dire che quando vedremo il grafico del MACD sui giornali specializzati, potremo tranquillamente bypassarlo con cognizione di causa. Nellambito della REGRESSIONE LINEARE che a tutti gli effetti largomento pi complesso di questo Corso, ci siamo serviti di una classificazione in famiglie, di cui la regressione occupa il posto B2. Rivediamo lo schema: Famiglia B2: indicatori statistici collegati da funzioni Excel (minimi quadrati di Gauss):

Regressione Lineare. In Excel =PREVISIONE Regressione Lineare. In Excel =TENDENZA Regressione Lineare. In Excel =PENDENZA

Regressione Lineare. In Excel =INTERCETTA Regressione Lineare. In Excel =RQ Regressione Lineare. In Excel =ERR.STD.YX Regressione Lineare. In Excel =REGR.LIN Regressione Lineare. In Excel =PEARSON Regressione Lineare. In Excel =CORRELAZIONE

La verifica che iniziamo oggi riguarda la relazione tra PENDENZA e RQ: arriveremo a un test finale di performance utilizzando entrambi gli strumenti Excel e Metastock. E poich stiamo procedendo per schemi, al termine di questa dispensa potremo spuntare un altro anello della catena delle relazioni delle funzioni (la spunta in azzurro):

2

R

100

Mentre di SLOPE sappiamo praticamente tutto ( la pendenza della retta di regressione con equazione Y = a+bx), di RQ non sappiamo ancora nulla, se non che fa parte della famiglia B2 dei minimi quadrati. Vediamo di conoscere RQ attraverso alcune definizioni: Metastock literature: R-squared show the percentage of movement that can be explained by linear regression Excel Guida: RQ restituisce il quadrato del coefficiente r della retta di regressione lineare tramite i valori in y_nota e x_nota. Per ulteriori informazioni, vedere la funzione PEARSON. Il quadrato del coefficiente r pu essere interpretato come il rapporto della varianza in y attribuibile alla varianza in x. Wikipedia: L'R, o coefficiente di determinazione, una misura della bont dell'adattamento (in inglese fitting) della regressione lineare stimata sui dati osservati Al momento non si capisce praticamente nulla, anzi, direi che mentre Metastock e Wikipedia ci lasciano intuire un vago concetto di misura della bont di qualcosa la definizione di Excel a dir poco sconcertante. Prima di affliggerci ulteriormente, possiamo per tentare un approccio furbo. Questo: poich con santa pazienza abbiamo studiato e verificato tutte le formule collegate, possiamo permetterci di vedere la questione al contrario. Ci che faremo sar il confronto tra RQ e SLOPE partendo dalla fine, cio dalle formule.

PREVISIONE CORRELAZIONE

TENDENZA PEARSON

PENDENZA

(SLOPE) REGR.LIN

INTERCETTA RQ ERR.STD.YX

FUNZIONI

STATISTICHE EXCEL

COLLEGATE

101

So bene che tutti questi SIGMA che vediamo sono ben poco incoraggianti ma da qui dobbiamo passare di sicuro: Ci sono in comune parecchi elementi ma ancora non si capisce molto. Per avvicinarci, vediamo le sole colonne del FoglioA della volta scorsa interessate al calcolo (il riferimento la solita data del 19 gennaio). Spezziamo in due parti per motivi di spazio:

RQuadrato =

Slope

(pendenza o

anche coeff.

angolare)

Col A Col E Col H Col I Col K Col L Col M Col O Col P Col R

Data Chius

02/01/12 15454 1 1 1 1 15454 238826116 238826116 15454

03/01/12 15645 2 3 9 5 31099 967147801 483592141 46744

04/01/12 15327 3 6 36 14 46426 2155373476 718509070 92725

05/01/12 14767 4 10 100 30 61193 3744583249 936573359 151793

06/01/12 14645 5 15 225 55 75838 5751402244 1151049384 225018

09/01/12 14401 6 21 441 91 90239 8143077121 1358438185 311424

10/01/12 14844 7 28 784 140 105083 11042436889 1578782521 415332

11/01/12 14882 8 36 1296 204 119965 14391601225 1800256445 534388

12/01/12 15192 9 45 2025 285 135157 18267414649 2031053309 671116

13/01/12 15011 10 55 3025 385 150168 22550428224 2256383430 821226

16/01/12 15220 11 66 4356 506 165388 27353190544 2488031830 988646

17/01/12 15325 12 78 6084 650 180713 32657188369 2722887455 1172546

18/01/12 15278 13 91 8281 819 195991 38412472081 2956304739 1371160

19/01/12 15651 14 105 11025 1015 211642 44792336164 3201258540 1590274

x2 (x)2 y2 (y)2

x y xy x y

Col S Col T Col U Col Y Col Z Col AA Col AB

=RQ

b b b R-quadr R-quadr R-quadr R-quadr

num denom coeff.ang. numerat denominat

(pendenza)

41426 3185 13,0066 8755681 410855185 0,0213 0,0213

102

Il 19 gennaio si vede: RQ (cio la colonna AA) = 0,0213 SLOPE (cio la colonna U) = 13,0066

ma RQ = Y/Z e PENDENZA = S/T in modo tale che scendendo nei dettagli delle formule si ottiene questo schema, uno schema che purtroppo, anchesso, ci lascer lamro in bocca. Lo guardiamo insieme per poi commentarlo: Ecco qua: ho evidenziato con lo stesso colore gli elementi comuni (la colonna R in rosso, la M in viola ) e sono arrivato alla poco confortante conclusione che mentre le colonne P e O sono presenti nella formula di RQ, esse mancano completamente nella formula dello SLOPE (in giallo e in rosso levidenza). Accidenti! Che peccato! Speravamo di capire qualcosa di RQ partendo da ci che gi conoscevamo (la PENDENZA) ma questo sarebbe stato possibile se gli elementi del confronto fossero stati tutti uguali, invece, macch, per colpa di P e di O non possiamo raffrontare alcunch. Pazienza! Troveremo unaltra strada per capire. Una cosa, per, labbiamo notata. In RQ compare:

P che la somma dei quadrati di Y (chiusure di Borsa) O che il quadrato della somma di Y stesso

Nota. Attenzione a non confondere la somma dei quadrati con il quadrato della somma. Nel caso del 19 gennaio, la somma dei quadrati (P) 3.201.258.540 mentre il quadrato della somma (O) vale 44.792.336.164. Ecco lintuizione: la comparsa di questi valori mastodontici rapportati in un certo modo < cio: P-(O-H) dove H il progressivo delle sedute di Borsa > ci fa subito pensare allintervento di un nuovo grande controllore , ovvero di uno stimatore dellerrore statistico. Per capirlo, vediamo lultimo passaggio di oggi perch nonostante la recente sconfitta didattica, sar proprio la potenzialit di Excel ad aiutarci. Se ben ricordate, nel contributo Opzioni in laboratorio 34 Visualizzare la Regressione Lineare in Excel eravamo arrivati a questo grafico:

Col. Col.

Y= (R-(I*M)/H) * (R-(I*M)/H) S= (H*R)-(I*M)

Z= (L-(K/H))*(P -(O /H)) T= (H*L)-K

P = P =

PRESENTI ASSENTIO = O =

RQ = Y/Z PENDENZA= S/T

(y)2

y2

(y)2 y2

Regressione lineare a 14 periodi del 19 gennaio

y = 13,007x + 15020

14200

14400

14600

14800

15000

15200

15400

15600

15800

0 2 4 6 8 10 12 14 16

103

Era stato Excel a costruire automaticamente per noi lequazione y = 13,007x + 15020 in rosso. E questo si era reso possibile perch nel Formato linea di tendenza avevamo checkato lopzione visualizza lequazione sul grafico. Se ora per noi spuntiamo anche lopzione successiva (Visualizza il valore R al quadrato sul grafico), otteniamo R2 = 0,0213 che corrisponde perfettamente al nostro dato della colonna AA. Questa lopzione Excel per ottenere R2 . Pi sotto il grafico con il dato R2 Alla fine della fiera ci ritroviamo: contenti da un lato (per il fatto che i nostri calcoli quadrano perfettamente) ma anche molto sconcertati dal valore di RQ. Sconcertati? Come mai?

Regressione Lineare 14 sedute al 19-gen-2012

y = 13,007x + 15020

R2 = 0,0213

14000

14200

14400

14600

14800

15000

15200

15400

15600

15800

0 2 4 6 8 10 12 14 16

104

Ma certo! Purtroppo per noi, RQ rappresenta la stima della bont della Regressione Lineare ottenuta. Perci vi dico subito che il valore ottenuto 0,0213 un valore per niente buono. La letteratura a questo proposito a dir poco spietata. Vediamo qualche stralcio: in statistica, il coefficiente di determinazione, (pi comunemente R2), una proporzione tra la variabilit dei dati e la correttezza del modello statistico utilizzato. Non esiste una definizione concordata di R2. Nelle regressioni lineari esso semplicemente il quadrato del coefficiente di correlazione. R2 varia tra 0 ed 1: quando 0, il modello utilizzato non spiega per nulla i dati; quando 1 il modello spiega perfettamente i dati Nel nostro caso, poich il valore 0,0213 molto vicino allo zero, pare proprio che il nostro fitting (come gi detto, fitting = misura della bont delladattamento), non possa andare troppo bene coi dati di Borsa. Gi! E proprio cos! Delusi? Io no, per niente! Infatti, secondo voi, cosa cera da aspettarsi da un cammino casuale come i valori di Borsa? Speravamo di trovare la perfezione? Ma certo che no! Se avrete voglia di controllare il nostro periodo campione (dal 19 gennaio al 12 giugno), vi accorgerete di un minimo di RQ a 0,0001 l8 marzo 2012 e di un massimo a 0,9379 il 16 aprile. Se poi volessimo fare la media otterremmo il valore 0,4402 che di per s un ottimo risultato, nellambito di un cammino casuale, ovviamente. Perci, stiamo sereni perch la Regressione Lineare continua a dimostrarsi pi che valida nellanalisi di Borsa. Questa puntata termina qui. La prossima volta vedremo di verificare le tesi della letteratura in merito alle indicazioni sui rapporti tra RQ e SLOPE: come al solito lanalisi verr eseguita coi dati reali di Borsa in nostro possesso. Non mancate allappuntamento: vi aspetto sempre su www.francescocaranti.net Francesco Caranti

105

Opzioni in laboratorio 37 RQ e SLOPE in Excel (2^ parte) Come abbiamo visto la volta scorsa, la regressione lineare non sempre in grado di spiegare i movimenti di Borsa che sono erratici per natura. A questo scopo la funzione RQ ci aiuta a conoscere il livello di affidabilit della retta di regressione. Abbiamo detto che RQ misura il grado di bont della regressione lineare, ovvero il fitting. Detto in termini ancora pi semplici: RQ larbitro della regressione lineare. Poich RQ dipende dal Dominio impiegato e pu fluttuare:

tra 0 (il modello utilizzato non spiega per nulla i dati) e 1 (il modello spiega perfettamente i dati)

possiamo tentare una verifica su una serie storica corposa partendo da un dominio basso (per esempio 5 giorni) e salendo via via fino a 6 mesi. Nel nostro caso, utilizzando il valore inferiore 5, copriamo una settimana lavorativa mentre col valore pi alto 120 arriviamo a 168 giorni di calendario, cio quasi a sei mesi. Questi sono i domini sui quali si svolger la nostra indagine: 9 intervalli tra 5 e 120 sedute. Ora importante fare questa osservazione:

quando il dominio basso, lindice di bont RQ sar alto al contrario, con domini alti, RQ sar basso

Per esempio: con dominio = 5 mi aspetto una buona risposta di RQ (cio valori abbastanza vicini a 1) mentre quando user il dominio 120 avr valori di RQ sempre pi sballati, valori cio che si allontanano da 1 e si avvicinano a 0. Il perch intuitivo: se la tenaglia di osservazione di una sola settimana, a parte casi molto particolari, il valore della regressione sar l nei pressi dellIndice ma se la mia indagine si estende a un periodo pi ampio, allora lo scarto Indice/Regressione aumenter considerevolmente e RQ (che misura la bont della stima) sar sempre pi lontana da 1 e sempre pi vicina allo zero. Lesempio della via Ferrarese ancora una volta convincente: lindagine tra paeselli vicini (C de Fabbri e Altedo) molto facile ma quella tra gli estremi (Bologna e Ferrara) sar molto pi complessa. Dopo aver stabilito le 9 fasce di indagine (domini = 5, 10, 14, 20, 25, 30, 50, 60 e 120) chiediamo aiuto alla letteratura che ha gi stabilito i valori critici per ciascun

2

R

Dominio

5

10

14

20

25

30

50

60120

106

dominio. Non solo: oltre ai qualcuno al posto nostro ha anche stabilito il livello cosiddetto di confidenza per quegli specifici valori critici. Nota: In statistica, la confidenza (o anche intervallo di fiducia) rappresenta lintorno dei valori plausibili per un certo parametro statistico. Limpostazione di questa congettura si deve a Jerzy Neyman (Moldavia 1894 / California 1981). Da tenere presente: una confidenza del 100% significa certezza, al contrario 0% assoluta incertezza. Vediamo dunque la tabella che mostra i critical values espressi al 95% di confidenza tratta dalla letteratura: il nostro compito sar quello di verificarli sul nostro Indice FTSEMIB. Per poter effettuare un test convincente, utilizziamo una serie storica di 2211 valori di Borsa: dal 2 gennaio 2004 al 10 agosto 2012. Per iniziare, memorizziamo in testata i successivi Critical Values dei singoli domini. Otteniamo cos lintestazione del nostro foglio Excel: e, a capo (per motivi di spazio): Ricordando che la sintassi della funzione RQ in Excel : RQ(y_nota;x_nota) possiamo calcolare i corrispondenti RQ. Nota per i programmatori Excel: Si utilizzano le funzioni INDIRETTO e INDIRIZZO specifiche per la riga mobile. A titolo di esempio potete cliccare la cella D10 dellesercitazione per ottenere la formula: =SE(RIF.RIGA()>> 0,77 0,40 0,27 0,20

RQ RQ RQ RQ RQ

25 30 50 60 120

0,16 0,13 0,08 0,06 0,03

107

Nelle prime quattro sedute, dal 2 al 7 gennaio, non succede assolutamente niente perch non abbiamo ancora i dati necessari per il calcolo di RQ a cinque sedute. L8 gennaio abbiamo finalmente il carico sufficiente di 5 sedute per trovare il corrispondente RQ che risulta 0,0087. Questo valore inferiore alla soglia consigliata di 0,77 quindi non lo marcheremo. Fino al 15 gennaio i valori di RQ sono sempre inferiori a 0,77 ma il 16, il 19 e il 20 abbiamo tre risultati validi che andremo a marcare con lok. Estendendo il calcolo ai domini successivi si ottiene questo copia-incolla di esempio: E chiaro che pi sale il dominio e pi aumentano i giorni necessari al calcolo, tanto che, per far partire limpianto complessivamente, occorrono 120 sedute di Borsa, cio occorre arrivare al 17 giugno 2004.

Close RQ

Data rettif. X -Nota 5

Critical Value -------- >>> 0,77

02/01/2004 26386 1

05/01/2004 26526 2

06/01/2004 26644 3

07/01/2004 26196 4

08/01/2004 26501 5 0,0087

09/01/2004 26441 6 0,0891

12/01/2004 26469 7 0,0105

13/01/2004 26395 8 0,2298

14/01/2004 26623 9 0,1325

15/01/2004 26731 10 0,6828

16/01/2004 26845 11 0,8697 ok

19/01/2004 27108 12 0,9726 ok

20/01/2004 27018 13 0,8545 ok

21/01/2004 27112 14 0,7669

22/01/2004 27071 15 0,4256

23/01/2004 27105 16 0,0350

26/01/2004 27089 17 0,3226

27/01/2004 27211 18 0,3920

28/01/2004 27277 19 0,8429 ok

Close RQ RQ RQ RQ RQ

Data rettif. X -Nota 5 10 14 20 25

Critical Value -------- >>> 0,77 0,40 0,27 0,20 0,16

02/01/2004 26386 1

05/01/2004 26526 2

06/01/2004 26644 3

07/01/2004 26196 4

08/01/2004 26501 5 0,0087

09/01/2004 26441 6 0,0891

12/01/2004 26469 7 0,0105

13/01/2004 26395 8 0,2298

14/01/2004 26623 9 0,1325

15/01/2004 26731 10 0,6828 0,1569

16/01/2004 26845 11 0,8697 ok 0,2835

19/01/2004 27108 12 0,9726 ok 0,5446 ok

20/01/2004 27018 13 0,8545 ok 0,8624 ok

21/01/2004 27112 14 0,7669 0,8566 ok 0,6591 ok

22/01/2004 27071 15 0,4256 0,8913 ok 0,6968 ok

23/01/2004 27105 16 0,0350 0,8575 ok 0,7737 ok

26/01/2004 27089 17 0,3226 0,7675 ok 0,8812 ok

27/01/2004 27211 18 0,3920 0,7554 ok 0,8675 ok

28/01/2004 27277 19 0,8429 ok 0,7482 ok 0,8784 ok

29/01/2004 27011 20 0,0000 0,3227 0,7376 ok 0,7883 ok

30/01/2004 26762 21 0,4518 0,0674 0,3796 ok 0,6415 ok

02/02/2004 26825 22 0,7996 ok 0,2019 0,0964 0,5469 ok

03/02/2004 26647 23 0,8603 ok 0,4989 ok 0,0243 0,4083 ok

04/02/2004 26668 24 0,7468 0,6334 ok 0,2705 ok 0,2111 ok

05/02/2004 26521 25 0,7540 0,7874 ok 0,5848 ok 0,0604 0,2622 ok

108

Solo a questo punto possiamo iniziare ad estrarre i primi risultati statistici. Il passo da fare adesso abbastanza intuitivo: andiamo a rintracciare gli eventi in cui tutti gli RQ erano contemporaneamente oltre la soglia di criticit. La mossa sensata: se tutti i 9 RQ sono buoni, ci significa che quelle sedute di Borsa erano particolari e sul significato del termine particolare faremo pi avanti tutte le osservazioni del caso. Allo scopo, inseriamo la nuova colonna V degli Eventi Contemporaneamente Soddisfatti: andiamo a capo come al solito: Il 26 agosto 2004, per la prima volta nella colonna degli Eventi Contemporaneamente Soddisfatti troviamo il valore 9 evidenziato in verde. La nuova colonna W Eventi singoli ad ogni nuovo evento riporta il valore 1 che ci servir per i conteggi finali. Nota: Il valore 9 pu rimanere vivo per pi di una seduta di Borsa ma verr conteggiato una volta soltanto nella colonna Eventi Singoli.

Close RQ RQ RQ RQ RQ RQ RQ RQ RQ

Data rettif. X -Nota 5 10 14 20 25 30 50 60 120

Critical Value -------- >>> 0,77 0,40 0,27 0,20 0,16 0,13 0,08 0,06 0,03

17/06/2004 27213 120 0,6786 0,7308 ok 0,8739 ok 0,8419 ok 0,7258 ok 0,5391 ok 0,2298 ok 0,0390 0,0059

18/06/2004 27266 121 0,8675 ok 0,7271 ok 0,8927 ok 0,9073 ok 0,7788 ok 0,6919 ok 0,1808 ok 0,0503 0,0050

21/06/2004 27031 122 0,0392 0,5800 ok 0,8102 ok 0,8861 ok 0,7657 ok 0,6987 ok 0,1546 ok 0,0590 0,0046

Close RQ RQ RQ RQ RQ

Data rettif. X -Nota 5 10 14 20 25

Critical Value -------- >>> 0,77 0,40 0,27 0,20 0,16

17/06/2004 27213 120 0,6786 0,7308 ok 0,8739 ok 0,8419 ok 0,7258 ok

18/06/2004 27266 121 0,8675 ok 0,7271 ok 0,8927 ok 0,9073 ok 0,7788 ok

21/06/2004 27031 122 0,0392 0,5800 ok 0,8102 ok 0,8861 ok 0,7657 ok

25/08/2004 25828 169 0,7653 0,8459 ok 0,2321 0,4358 ok 0,4271 ok

26/08/2004 25942 170 0,8635 ok 0,8623 ok 0,5702 ok 0,2744 ok 0,3451 ok

27/08/2004 26097 171 0,9111 ok 0,8531 ok 0,6907 ok 0,0912 0,2379 ok

30/08/2004 26024 172 0,8361 ok 0,8955 ok 0,9016 ok 0,0052 0,1932 ok

31/08/2004 25932 173 0,2037 0,8236 ok 0,8981 ok 0,0502 0,1439

RQ RQ RQ RQ EVENTI EVENTI

30 50 60 120 CONTEMPORANEAMENTE SINGOLI

0,13 0,08 0,06 0,03 SODDISFATTI:

0,5391 ok 0,2298 ok 0,0390 0,0059 6 0

0,6919 ok 0,1808 ok 0,0503 0,0050 7 0

0,6987 ok 0,1546 ok 0,0590 0,0046 6 0

0,5709 ok 0,8554 ok 0,7036 ok 0,0919 ok 7 0

0,4922 ok 0,8329 ok 0,7443 ok 0,0970 ok 9 1

0,3812 ok 0,7950 ok 0,7582 ok 0,1020 ok 8 0

0,3004 ok 0,7671 ok 0,7591 ok 0,1199 ok 8 0

0,2330 ok 0,7507 ok 0,7603 ok 0,1391 ok 6 0

109

A questo punto siamo in grado di totalizzare i nostri risultati scoprendo la riga 4 del nostro foglio di lavoro: e, a capo: Conclusione: in 2091 sedute (dal 17 giugno 2004 al 10 agosto 2012) ci sono stati 55 casi in cui tutti gli RQ dei 9 domini erano contemporaneamente oltre il corrispondente critical value. Per capirci un po di pi, possiamo subito estrarre le date dei 55 risultati ordinati in colonne annuali in modo da poter interpretare il contesto oggettivo: La prima cosa da osservare la diversa distribuzione degli eventi nel tempo: passiamo cio da ben 13 eventi nel corso del 2005 a un solo evento nel 2010 e questo dato ci disorienta un po perch il trader di Borsa deve poter disporre di segnali continui e regolari. Il sistema dunque irregolare nel tempo. Per poter comprendere realmente come si sono svolti i fatti, creiamo una nuova tabella con queste informazioni: Data, Close, Performance e Timing del periodo. Una volta compreso il fatto che un Sistema simile non facilmente praticabile per via della instabilit dei segnali, vediamo comunque di interpretare se a questi corrisponde almeno un effettivo punto di svolta importante del mercato perch se cos fosse, potremmo accontentarci di aver rintracciato almeno i punti estremi pur rinunciando alla linearit della frequenza. La tabella mostra le date salienti calcolate dal programma. Vediamo:

Close RQ RQ RQ RQ RQ

Data rettif. X -Nota 5 10 14 20 25

Critical Value -------- >>> 0,77 0,40 0,27 0,20 0,16

Frequenza ----------- >>> 619 1188 1356 1510 1607

RQ RQ RQ RQ EVENTI EVENTI

30 50 60 120 CONTEMPORANEAMENTE SINGOLI

0,13 0,08 0,06 0,03 SODDISFATTI:

1680 1786 1808 1924 118 55

26/08/04 04/01/05 20/02/06 08/01/07 17/01/08 12/01/09 07/01/10 17/02/11 03/02/12

05/10/04 02/02/05 16/08/06 07/02/07 18/03/08 23/01/09 15/03/11 19/03/12

03/11/04 04/02/05 30/08/06 09/04/07 10/06/08 19/02/09 27/06/11 17/05/12

08/12/04 15/02/05 02/10/06 07/06/07 20/06/08 09/03/09 04/08/11

23/12/04 23/02/05 06/10/06 01/07/08 05/05/09 12/10/11

01/04/05 07/11/06 15/07/08 26/08/09 22/11/11

08/04/05 15/11/06 08/10/08 15/09/09

30/05/05 23/11/06 24/10/08

26/07/05

19/09/05

21/11/05

15/12/05

29/12/05

RQ CONTEMPORANEAMENTE SODDISFATTI (oltre il corrispondente Critical Value) nel tempo

110

No, purtroppo non come avremmo sperato: i punti di svolta di questo schema non corrispondono quasi mai ad estremi importanti di periodo. La nostra conclusione si conferma amara ma lesercitazione comunque servita a mettere in cantina unipotesi che sembrava allettante e ampiamente confortata dalla letteratura come si ricava da questo stralcio: To determine if the trend is statistically significant for a given x-period linear regression line, plot the r-squared indicator and refer to the following table.

Data Close Parte un: Fino a: Indice Perform: Timing

26/08/2004 25942 Rialzo 21/09/2004 27069 4,34 50

05/10/2004 27578 Rialzo 02/11/2004 28001 1,53 28

03/11/2004 28053 Rialzo 07/12/2004 29074 3,64 21

08/12/2004 29169 Rialzo 22/12/2004 29649 1,65 25

23/12/2004 29742 Rialzo 03/01/2005 29875 0,45 11

04/01/2005 29960 Rialzo 01/02/2005 30366 1,36 8

02/02/2005 30413 Ribasso 03/02/2005 30387 0,09 21

04/02/2005 30733 Rialzo 14/02/2005 31130 1,29 2

15/02/2005 31191 Ribasso 22/02/2005 30359 2,67 7

23/02/2005 30256 Rialzo 31/03/2005 31125 2,87 6

01/04/2005 31297 Rialzo 07/04/2005 31658 1,15 27

08/04/2005 31616 Ribasso 27/05/2005 30548 3,38 5

30/05/2005 30716 Rialzo 25/07/2005 32389 5,45 36

26/07/2005 32405 Rialzo 16/09/2005 33279 2,70 41

19/09/2005 33269 Ribasso 18/11/2005 32789 1,44 39

21/11/2005 32905 Rialzo 14/12/2005 33726 2,50 45

15/12/2005 33745 Rialzo 28/12/2005 34559 2,41 18

29/12/2005 34646 Rialzo 17/02/2006 36038 4,02 10

20/02/2006 36224 Ribasso 15/08/2006 35536 1,90 37

16/08/2006 35974 Rialzo 29/08/2006 36423 1,25 127

30/08/2006 36608 Rialzo 29/09/2006 37073 1,27 10

02/10/2006 37043 Rialzo 05/10/2006 37538 1,34 23

06/10/2006 37535 Rialzo 06/11/2006 38743 3,22 4

07/11/2006 38861 Rialzo 14/11/2006 39027 0,43 22

15/11/2006 39326 Rialzo 22/11/2006 39372 0,12 6

23/11/2006 39373 Rialzo 05/01/2007 40081 1,80 6

08/01/2007 40014 Rialzo 06/02/2007 41064 2,62 32

07/02/2007 41306 Ribasso 06/04/2007 40916 0,94 22

09/04/2007 40916 Ribasso 06/06/2007 40765 0,37 43

07/06/2007 40398 Ribasso 16/01/2008 35297 12,63 42

17/01/2008 34917 Ribasso 14/03/2008 30505 12,64 154

18/03/2008 30291 Rialzo 09/06/2008 30565 0,90 42

10/06/2008 30201 Ribasso 19/06/2008 29261 3,11 57

20/06/2008 28766 Ribasso 30/06/2008 28276 1,70 8

01/07/2008 27737 Ribasso 14/07/2008 26736 3,61 7

15/07/2008 26058 Ribasso 07/10/2008 22760 12,66 10

08/10/2008 21462 Ribasso 23/10/2008 20294 5,44 60

24/10/2008 19154 Rialzo 09/01/2009 19361 1,08 12

12/01/2009 19185 Ribasso 22/01/2009 16736 12,77 51

23/01/2009 16652 Ribasso 18/02/2009 15976 4,06 9

19/02/2009 15899 Ribasso 06/03/2009 12425 21,85 19

09/03/2009 12161 Rialzo 04/05/2009 19070 56,81 12

05/05/2009 18967 Rialzo 25/08/2009 21654 14,17 38

26/08/2009 21732 Rialzo 14/09/2009 22190 2,11 81

15/09/2009 22265 Rialzo 06/01/2010 22760 2,22 14

07/01/2010 22845 Ribasso 16/02/2011 22322 2,29 78

17/02/2011 22333 Ribasso 14/03/2011 21009 5,93 286

15/03/2011 20586 Ribasso 24/06/2011 18809 8,63 18

27/06/2011 18949 Ribasso 03/08/2011 16699 11,87 72

04/08/2011 15837 Ribasso 11/10/2011 15747 0,57 28

12/10/2011 16207 Ribasso 21/11/2011 14247 12,09 48

22/11/2011 14028 Rialzo 02/02/2012 15983 13,94 29

03/02/2012 16143 Rialzo 16/03/2012 16682 3,34 52

19/03/2012 16824 Ribasso 16/05/2012 13043 22,47 31

17/05/2012 12853 Rialzo 10/08/2012 14548 13,19 40

111

This table shows the values of r-squared required for a 95% confidence level at various time periods. Number of Periods R-squared Critical Value (95%confidence) 5 0.77 10 0.40 14 0.27 20 0.20 25 0.16 30 0.13 50 0.08 60 0.06 120 0.03 Prima di concludere largomento Regressione Lineare dovremo ancora indagare in merito al rapporto RQ / SLOPE che vi suggerirei di seguire attentamente nel corso della prossima lezione. Non mancate allappuntamento su www.francescocaranti.net Francesco Caranti

112

Opzioni in laboratorio 38 RQ e SLOPE in Excel (3^ parte) Il nostro viaggio tra gli oscillatori e le funzioni statistiche di Excel prosegue oggi con lanalisi di RQ e Slope contemporaneamente. Ci che vogliamo testare quanto narra la letteratura al proposito: il nostro compito quello di ficcare il naso e trarre le conclusioni. Partiamo subito con gli enunciati in cui ho evidenziato i punti forti: ... it is helpful to consider r-squared in relation to Slope (see Linear Regression Slope).

Slope gives you the general direction of the trend (positive or negative) R-squared gives you the strength of the trend

A high r-squared value can be associated with a high positive or negative Slope. Although it is useful to know the r-squared value, ideally, you should use r-squared in tandem with Slope.

High r-squared values accompanied by a small Slope may not interest short term traders. However, high r-squared values accompanied by a large Slope value may be of huge

interest to traders .... In pratica la letteratura dice che Slope (= pendenza della regressione lineare) responsabile della direzione del trend mentre R-squared (= R quadrato della regressione lineare) determina la forza del trend. Dunque qui si parla di forza e direzione speriamo che tutto corrisponda! Togliamoci subito dalle nebbie delle definizioni accademiche e guardiamo coi nostri occhi i grafici: RQuadrato (blu) e Slope (rosso) entrambi a 14 periodi dellormai noto periodo preso in esame: gennaio/giugno 2012. Forse si nota subito qualche coincidenza tra la blu e la rossa ma anche vero il contrario, cio che la blu al top e la rossa striscia il bordo inferiore del grafico. Ma andiamo avanti con gli enunciati:

2

R /Slope

22012

9 16 23 30 6February

13 20 27 5March

12 19 26 2April

10 16 23 30May

7 14 21 28 4June

11 18 25

-200-190-180-170-160-150-140-130-120-110-100

-90-80-70-60-50-40-30-20-10

0102030405060708090

100110120130

12500

13000

13500

14000

14500

15000

15500

16000

16500

17000In rosso: RQuadrato (14 periodi)in blu: SLOPE (14 periodi)

FTSEMI20120518, r-squared, Linear Regression Slope

113

A high r-squared value can be associated with a high positive or negative Slope. ... Pare che occorra prestare attenzione alla combinazione delle condizioni:

Alti valori della rossa (r-squared) Valori molto positivi o molto negativi della blu (slope)

Prima di partire con linvestigazione, proviamo a commentare ad alta voce:

Alti valori della rossa (RQ) significa che il famoso fitting (cio lindice di bont) orientato al valore 1 che significa che ladattamento della Regressione Lineare alla serie storica teoricamente perfetto. Ricordo ancora che RQ=0 una pessima adattabilit, RQ=1 la risposta migliore possibile

Valori molto alti o molto bassi della blu (cio: valori estremi di Slope) significa una pendenza molto forte. Volendo fare un esempio semplice: se scendo con gli sci da una pista nera posso star sicuro che il trend in corso molto pronunciato e mi fermer solo quando sar sceso a valle, al contrario se arranco sotto i portici che da Bologna salgono al colle di San Luca, allora sono consapevole che il fiatone mi rester fino alla vetta

Lipotesi dellautore a stelle e strisce sembra piuttosto sensata, si tratta solo di vederla in pratica. Bene: accettiamo la sfida partendo con le 2211 osservazioni dal gennaio 2004 allagosto 2012. Teniamo fisso a 14 il dominio per entrambe le funzioni =RQ e =PENDENZA. Vediamo subito cosa accade in questo copia-incolla. Naturalmente per le due funzioni abbiamo rispettato i colori rosso e blu del grafico Metastock. Quello che vediamo in alto (Min e Max) il range di RQ e SLOPE per tutte le 2211 osservazioni e abbiamo subito la conferma matematica: RQ sempre maggiore di zero e non pu andare in negativo. Loscillazione tra 0,000010 (abbiamo dovuto usare 6 decimali per poterci orientare). Il range di Slope oscilla tra valori ampiamente negativi (-477,1670) e valori positivi (258,5341) e come ormai sappiamo questi valori corrispondono al coefficiente angolare dellequazione della retta di regressione (potete seguire lexcel del foglio RQ-SLOPE). A questo punto, non potendo di certo seguire tutte le combinazioni RQ/SLOPE di tutte le 2211 sedute di Borsa, dobbiamo eseguire un primo stralcio: in pratica utilizziamo la funzione Dati Ordina di Excel chiedendo che lordinamento avvenga in modalit descending in modo da ottenere in testa i valori con lo Slope pi alto: cio stiamo osservando le maggiori salite dellangolo di regressione (potete seguire il foglio Excel: SLOPE-descending).

Close RQ SLOPE

Data rettif. X -Nota 14 14

MIN MIN0,000010 -477,1670

MAX MAX0,970417 258,5341

02/01/2004 26386 1

05/01/2004 26526 2

06/01/2004 26644 3

07/01/2004 26196 4

08/01/2004 26501 5

09/01/2004 26441 6

12/01/2004 26469 7

13/01/2004 26395 8

14/01/2004 26623 9

15/01/2004 26731 10

16/01/2004 26845 11

19/01/2004 27108 12

20/01/2004 27018 13

21/01/2004 27112 14 0,659087 55,3648

22/01/2004 27071 15 0,696809 59,1516

23/01/2004 27105 16 0,773687 65,5143

26/01/2004 27089 17 0,881198 72,7648

27/01/2004 27211 18 0,867487 66,7758

114

Vediamo limmagine dei primi risultati: Per ridurre il test a un campione umanamente gestibile, riduciamo a 100 le prime osservazioni tramite leliminazione della coda meno significativa delle 2111 prove successive (Foglio Excel: SLOPE-descending-100). Per completare il lavoro, partendo dallo stralcio dei 100 risultati pi significativi, ordiniamo il foglio per data in modo da poter seguire levoluzione degli eventi storicamente pi significativi: (Foglio Excel: SLOPE-descending-100-data). Annotiamo questi eventi tramite un numero progressivo accorpando quelli di giornate successive (o vicine) fino a ottenere lo stralcio pi sotto. Nota. Lesempio pu chiarire: il 7, 8 e 9 aprile 2004 levento viene considerato come unico. Unulteriore sintesi dei risultati ottenuti ci porta a questa tabella riassuntiva dei Massimi Valori di Slope nel periodo considerato: 2004 / 2012.

Close RQ SLOPE

Data rettif. X -Nota 14 14

(descending)

26/03/2009 15881 1348 0,952055 258,5341

09/04/2008 32414 1104 0,928915 251,1890

25/03/2009 15670 1347 0,944884 244,9033

27/03/2009 15747 1349 0,948643 244,4418

10/04/2008 32300 1105 0,903083 240,3802

08/04/2008 32445 1103 0,865073 231,5077

30/03/2009 14712 1350 0,819815 213,0044

24/03/2009 15259 1346 0,869091 205,7516

08/05/2009 19761 1376 0,949037 202,4967

27/07/2009 19604 1432 0,953808 201,0242

20/04/2009 17084 1363 0,873911 199,1780

11/05/2009 19464 1377 0,938635 196,8967

17/04/2009 17835 1362 0,859047 196,2615

07/04/2008 32392 1102 0,734834 195,3582

11/04/2008 31969 1106 0,815436 192,9407

31/03/2009 15296 1351 0,759892 192,8484

10/11/2008 21272 1255 0,419743 189,9560

24/07/2009 19425 1431 0,907959 186,5868

Close SLOPE RQ

Evento Data rettif. X -Nota 14,00 14

(descending)

da 258,53

a 122,75

1 07/04/2004 26871 69 122,75 0,855630

08/04/2004 26965 70 133,53 0,924653

09/04/2004 26965 71 127,20 0,900737

2 27/02/2006 36926 562 124,45 0,916336

3 04/07/2006 35400 653 127,55 0,842976

4 29/03/2007 40244 845 138,94 0,617955

30/03/2007 40249 846 164,20 0,770932

5 02/04/2007 40460 847 177,59 0,827108

03/04/2007 40853 848 163,64 0,832549

04/04/2007 40866 849 156,74 0,824599

05/04/2007 40916 850 139,18 0,823631

06/04/2007 40916 851 130,08 0,804418

12/04/2007 41198 855 126,05 0,905054

13/04/2007 41449 856 124,42 0,901091

16/04/2007 41857 857 127,17 0,899665

6 04/09/2007 38854 956 135,66 0,726720

7 26/09/2007 38611 972 126,58 0,741847

115

Come possiamo vedere, a fronte di un 2005 senza eventi, il 2009 lanno pi ricco di evoluzioni dello Slope. I primi risultati di questa tabella sono purtroppo un po deludenti poich la distribuzione degli eventi non regolare: in altre parole i risultati non sono spalmati nel tempo come si vorrebbe, una delusione per il trader di Borsa che non pu e non deve rinunciare al sostegno dellanalisi tecnica. Non ci resta che monitorare uno per uno i 23 eventi del periodo in esame ma anche in questo caso si potrebbe notare che le date evidenziate non corrispondono ad alcun punto di svolta significativo del mercato. Un esempio la prima data della tabella: 7 aprile 2004. La prima barra blu a sinistra si riferisce al 7 aprile: fino a quella data il mercato si mosso in trading range tra 25500 e 27500. Purtroppo, nonostante lindicazione di Slope, cos rimasto fino alla fine di settembre di quel lontano 2004. Questo esempio vale come monito: Slope unottima componente (combinata a RQ) ma solo in termini di costituzione della Regressione Lineare. Purtroppo, nonostante le indicazioni della letteratura, n Slope n RQ ci risultano performanti in termini di trading.

2004 2005 2006 2007 2008 2009 2010 2011 2012

07/04/04 N/D 27/02/06 29/03/07 04/04/08 23/03/09 12/03/10 21/01/11 08/08/12

04/07/06 02/04/07 07/11/08 15/04/09 18/06/10 10/10/11

04/09/07 05/05/09 15/07/10 08/12/11

26/09/07 23/07/09

06/12/07 18/09/09

20/10/09

1 0 2 5 2 6 3 3 1

SLOPE(14) AI MASSIMI VALORI

EVENTI PER ANNO

23 1 8March

15 22 29 5April

12 19 26 3May

10 17 24 31 7June

14 21 28 5July

12 19 26 2 9August

16 23 30 6 13September

20 27 4 11October

18 25 1November

24900

25000

25100

25200

25300

25400

25500

25600

25700

25800

25900

26000

26100

26200

26300

26400

26500

26600

26700

26800

26900

27000

27100

27200

27300

27400

27500

27600

27700

27800

27900

28000

25000

25500

26000

26500

27000

27500

28000

Dal 7 aprile 2004, fino a ottobre,nonostante le indicazioni di Slope,il mercato si mosso solo in trading range.

FTSEMI20120518

116

A questo punto non ci resta che aggiungere un tassello alla nostra tabella nella zona blu della regressione lineare: RQ e Slope non sono consigliabili per il trading credo sia il giusto commento per questi Indici che restano comunque particolarmente interessanti nel contesto dellargomento globale della Regressione Lineare. Vi aspetto per la discussione sullIndicatore Time Series Forecast (TSF) che proviene dallanalisi della regression lineare e che della regressione lineare sicuramente il miglior derivato in assoluto. Sempre su questo sito: www.francescocaranti.net. Vi attendo. Francesco Caranti

Dispensa Indicatore Param. Volumi Giudizio

12-13 Aroon 14 no Per trend veloci

14 RSI 14 no Controlla gli eccessi

15 MACD 12-26 no Solo 'popolare'

16 DEMA - TEMA 21 no Buoni in molte circostanze

17 Chaikin A/D 3-10 si Attenzione a interpretarlo

18-19-20 Linear Regression Indicator 14 no Molto potente - molto veloce

31-32-33-34 Linear Regression Trendline 14 no Da abbinare al Linear Regression Indicator

35-36-37 RQ e Slope 14 no Non consigliabile per il trading

21-22-23 Deviazione Std 14 no Non tradabile - misura gli eccessi - migliorabile

24 Bande di Bollinger 20 no No comment 29-30 Ultimate 7,14,28 no Controlla bene gli eccessi - regola un po cabalistica

Questi, invece, gli Indicatori/Indici proprietari:

25 Linea Verde Caranti nessuno no Baricentro - Base di Chebyshev

27-28 Perc. D.S. Caranti 14/20 no Deriva da D.S. - misura gli eccessi - collaudato

117

Opzioni in laboratorio 39 TSF Time Series Forecast Pare proprio che largomento Regressione Lineare non debba avere mai fine ma vi assicuro che siamo ormai al traguardo. In effetti abbiamo voltato e rivoltato la questione come un calzino ma, credetemi, ne valsa la pena perch a questo punto largomento stato sviscerato come pi non si poteva. Oggi la volta del TSF, acronimo di Time Series Forecast e lequazione rappresentata nel logo parla gi da s: lindicatore TSF si ottiene semplicemente sommando il Linear Regression Indicator (=PREVISIONE in Excel) allo Slope (=PENDENZA in Excel). Ecco lesempio del 19 gennaio 2012 con periodo di 14 sedute: La letteratura al proposito molto chiara e ci conferma tutte le nostre tesi: ... The Time Series Forecast indicator is based on the trend of a security's price over a specified time period. The trend is determined by calculating a linear regression trendline using the "least squares fit" method. The least squares fit technique fits a trendline to the data in the chart by minimizing the distance between the data points and the linear regression trendline. Any point along the Time Series Forecast is equal to the ending value of a Linear Regression trendline plus its slope. For example, the ending value of a Linear Regression trendline (plus its slope) that covers 10 days will have the same value as a 10-day Time Series Forecast. This differs slightly from the Linear Regression indicator (see Linear Regression Indicator) in that the Linear Regression indicator does not add the slope to the ending value of the regression l