LE SERIE STORICHE DEI DATI METEOROLOGICI
Rodica Tomozeiu
OutlineOutline
••Definizione di serie storicaDefinizione di serie storica
••I problemi nell’analisi delle serie storicheI problemi nell’analisi delle serie storiche
••Variabilità temporale, spazialeVariabilità temporale, spaziale
••Esempio di analisi di serie storicheEsempio di analisi di serie storiche
Lo studio …
Le serie storiche possono essere definite come un set di dati climatici consecutivi nel tempo, relativi ad una certa area geografica e ad uno specifico intervallo di tempo (generalmente lungo).
Che cosa e’ una serie storica?Che cosa e’ una serie storica?
su singole serie di dati
Su un insieme di serie d dati relative alle stazioni localizzate in una certa area
1. DISTRIBUZIONE SPAZIALE DELLE STAZIONI SUL TERRITORIO
2. LUNGHEZZA DELLA SERIE TEMPORALE
3. COMPLETEZZA DELLA SERIE TEMPORALE
4. QUALITÀ DEI DATI
5. OMOGENEITÀ DEI DATI
Quali sono i problemi nell’analisi dei dati?
1. DISTRIBUZIONE DELLE STAZIONI
•uniformità
1707
1713
1719
1744
1747
17481750
1753
1754
17561773
17771778
17971808
1810
1828
18371885
1921
1932
1937
1942
1973
1985
19931783
2207 2221
2248
22602271
2276
2288
2296
2301
2320
2330
23372338 2350
23512353
2358
23752377
2414
2259
228122822283
2341
2349
23872388
2361
2390
2408
2346
23802405
2327
44 stazioni- temperature giornaliere(1956-2000)62 stazioni –precipitazione giornaliere(1951-2000)
Esempio: rete di stazioni giornalieri di temperatura e precipitazioni in Emilia-Romagna
• densità delle stazioni? …dipende dal parametro analizzato
2-3. Lunghezza e completezza delle serie temporale
•La lunghezza delle serie deve essere adeguata agli scopi degli studi
•OMM raccomanda di studiare le proprietà statistiche dei dati meteorologici usando serie temporali di almeno 30 ani:1901-1930, 1931-1960,1961-1990.
•Completezza =stazioni con più del 80% di dati sono prese in considerazione (STARDEX project)
4. Qualità dei dati
•Controlli logici
•Controlli climatologici
•Controlli temporali
V.Pavan, R.Tomozeiu,A.Selvini, S.Marchesi, C.Marsigli, 2003. “Controllo di qualità dei dati giornalieri di temperatura minima Controllo di qualità dei dati giornalieri di temperatura minima e e massima e di precipitazionemassima e di precipitazione”,Quaderno Tecnico ARPA,No.15
(http://www.arpa.emr.it/smr/archivio/downloads/quaderni)
5. OMOGENEITÀ DEI DATI
• ..per eliminare le eventuali influenze di fattori esterni che possono cambiare l’analisi dei dati (spostamento della stazione, cambiamento dello strumento…)
Una serie temporale di una variabile si definisce omogenea se le sue variazioni sono dovute unicamente alle modificazioni del tempo meteorologico e/o del clima.
Perché studiare l’omogeneità dei dati?
Test statisticiTest statistici - sono strumenti per decidere se accettare o rifiutare l’ipotesi formulata.
(Ho -ipotesi nulla, H1 -ipotesi alternativa)Classificazione:• test parametrici - sono quelli in cui si fa un’ipotesi sulla distribuzione della popolazione dei dati.
•test non parametrici - sono indipendenti dalla distribuzione della popolazione
Tipi di erroreI tipoI tipo: rigettare H0 quando è vera, cioè rigettare tutti quei valori X tali che hanno una probabilità cumulata P(x <= X) > 1-a; a è detto livello di significatività del test, e di solito è posto uguale a 0.05 o 0.01.
II tipoII tipo: accettare H0 quando è falsa; supponendo di conoscere la distribuzione alternativa H1,che non è sempre vero,
significa accettare tutti quei valori X tali che hanno una probabilità cumulataP(x <= X) > b; 1- b è detto
potenza del test.
test di omogeneità -SNHT
Come si verifica ipotesi di omogeneità ???Una serie è omogenea se il rapporto o la differenza (Q) tra i valori della serie campione e quelli della serie di riferimento èapprossimativamente costante nel tempo.
Referenze•Alexandersson H, Moberg A (1997) Homogenization of Swedish temperature data. Part I: a homogeneity test for linear trends. Int. J. Climatol 17: 25-34•Hanssen-Bauer I, Forland E, and Nordli PO, (1991) Homogeneity test of precipitation data, descriptions of the methods used at DNMI’, DNMI Report 13/91 Norwegian Meteorological Institute, pp 28
Criteri di accetazione di una non omogeneità:Una serie è classificata come non omogenea se almeno uno dei
seguenti criteri è soddisfatto (Hanssen –Bauer,1993):1)la serie contiene una non omogenità significativa al 95%2) la seria contiene una non omogenità significativa al 90%,confermata dal “metadata”
T-unadjasted data
0
20
40
60
1900 1920 1940 1960 1980
Years
T
T-adjusted data
02468
10
1900 1915 1930 1945 1960 1975 1990
Years
T st
atist
ics
SERIE NONOMOGENEASERIE NONOMOGENEA SERIE “AGIUSTATA”SERIE “AGIUSTATA”
Studio delle serie storicheStudio delle serie storiche--variabilità, temporalevariabilità, temporale
•tipo di distribuzione + momenti di vari ordine (media,mediana, varianza…);
•tendenza (tipo di tendenza+ significatività)
• punti di cambiamento (test di Student…);
•ciclicità (analisi spettrale);
Cosa guardiamo ad una serie temporale?
••per stimare la tendenza degli parametri: regressione per stimare la tendenza degli parametri: regressione lineare lineare -- metodo dei minimi quadrati;metodo dei minimi quadrati;
••per stimare la significativitper stimare la significativitàà delle tendenze: test delle tendenze: test statistico nonstatistico non--parametrici (parametrici (MannMann--KendallKendall test).test).
Referenze:
Sneyers R (1975) Sur l’analyse statistique des series d’observations. Notetechnique OMM, 143: 189 pp
Wilks, S.D., 1995: Statistical Methods in the Atmospheric Sciences, vol. 59, International Geophysics Series, Academic Press, 467pp.
……
…analisi della variabilità spaziale…analisi della variabilità spaziale
Metodi: analisi cluster;empirical orthogonal function (EOF)
Wilks, S.D., 1995: Statistical Methods in the Atmospheric Sciences, vol. 59, International Geophysics Series, Academic Press, 467pp
ReferenzeReferenze
Lo scopo: identificare delle zone con caratteristiche simileLo scopo: identificare delle zone con caratteristiche simile
Esempio di analisi della variabilità temporale e spaziale
Nr Indice
1. 90mo percentile Tmax
2. Onde di calore(HWD)
Dati: •temperatura massima giornaliera-estate
• 44 stazioni(Emilia-Romagna) , periodo 1958-2000
0.06
0.04
-0.010.03
0.010.1 0.08
-0.010.02
0.07 0.04
0.0440.087
0.05
0.090.1
0.051
0.023
0.036
0.049
0.07
0.070.07
0.07
0.122
-0.01
Distribuzione del coefficiente del trend per TmaxTmax (°C/(°C/stagionestagione))derivati nel periodo 1960-2000
Il colore rappresenta la significatività del trend (95% rosso chiaro-99% rosso scuro
Trends della Tmax(GLA) in Emilia-Romagna
Distribuzione 90mo percentile di Tmax estiva (GLA) con il trend (°C/stagione) associato
31.9
32.4
30.7
27.8
33
28.8
33.733.2
32.9
25.626.8
32.8 31.8
33.129.1
33.8
33.834.2
34
33.2
33.1
32.1
33.4
30.9
32.6
32.5
29.431.1
32.7
28.6
30.4
-0.03 -0.01 0.01 0.03 0.05 0.07 0.09
Periodo 1958-2000
Le stazioni contrassegnate da un cerchio sono caratterizzate da valori di tendenza significativi, l’ombreggiatura indica il valore della tendenza e i valori presso le stazioni indica i valori medi(1960-2000) estivi del indice
Distribuzione del HWD (numero di giorni) con il trend (giorno/stagione) associato 1958-2000
Cerchio rosso=trend significativo al 95%, l’ombreggiatura indica il valore della tendenza, i valori presso le stazioni indica i valori medi(1960-2000) estivi del HWD
Giorno/stagione
0.97
0.5
1
0
2.5
1.7
0.35
1.4
3.1
2
2.1 0.55
2.9
2.7
2.6
2.62.2
2.6
1.2
0.53
1.8
1.2
0.91
1.5
0.51
4.5
4.4
2.6
6.5
0.25
0.0 0.1 0.2 0.3 0.4 0.5
1713
1719
1750 1808
1921 1937
1973
2207 2221
2248
2271
2276
2281
2288
2327
2338
2341
2346
2350
2353
2358
2375
2388
Variabilità spaziale Variabilità spaziale ––cluster cluster 90mo percentile 90mo percentile TmaxTmax
ClusterCluster 11
ClusterCluster 22
Analisi da sviluppare Analisi da sviluppare ––analisi spettrale…..analisi spettrale…..
GRAZIE PER LA PAZIENZA ...GRAZIE PER LA PAZIENZA ...
• Ipotesi nulla (H0) { }niNiZ ,...,1)1,0( ∈∈
• Ipotesi alternativa (H1){ }
{ }
+∈∈∈∈
naiNiZaiNiZ
,...,1)1,2(,...,1)1,1(
µµ
•Statistica del test SNHT { } { }22
21
1111max )(maxmax zanzaTT
nana
Sa
S −+==−≤≤−≤≤
•Fattore di correzione FA=
12 qq −
Qzq Q += 11 σ
dove Qzq Q += 22 σ
Test SNHT Test SNHT -- un solo punto di non omogeneitàun solo punto di non omogeneità
se teorTST maxmax > Si rigetta l’ipotesi nulla
FA=
12 / qq (P)
(T)
a= anno di non omogeneità
La correzione si applica nell’intervallo (1…..a)
Ipotesi del test: HH00 - assenza di una tendenza nella serie dei datiHH11 - presenza di una tendenza
Sia x1..........xn una serie di dati.Per ogni elemento della serie si determina il numero ni di elementiche lo precedono, ossia tali che xi> xj
u t t E t t( ) [ ( )] / var( )= −
t nii
= ∑
se u(t) >1.96 si rigetta l’ipotesi nulla al livello di significatività del 95%
La seria presenta una tendenza positiva
TEST di MANN-KENDALL
statistica del test:
E(t)= n(n-1)/4 e Var(t) = n(n-1)(2n+5)/72
La funzione di distribuzione di t t e asintoticamente normale con media e varianza:
Top Related