Caratteristiche dei dati ecologici

of 43/43
Caratteristiche dei dati ecologici I dati sono “sparsi”, cioè hanno molti valori nulli (a volte la maggioranza!) La gran parte delle specie presenti è rara. I fattori ambientali che influenzano la distribuzione delle specie sono molteplici e combinati fra loro,... ...ma quelli veramente importanti sono pochi (bassa dimensionalità intrinseca). I dati contengono molto “rumore” sia per eventi stocastici e contingenti, sia per l’errore di osservazione (anche in condizioni ideali le repliche sono diverse!) L’informazione è spesso ridondante (la specie A è associata alla specie B, ma questa può essere associata alla specie C, etc.): questo è un problema, ma è anche ciò che rende possibile interpretare i dati ecologici.
  • date post

    13-Jan-2016
  • Category

    Documents

  • view

    49
  • download

    0

Embed Size (px)

description

Caratteristiche dei dati ecologici. I dati sono “sparsi”, cioè hanno molti valori nulli (a volte la maggioranza!) La gran parte delle specie presenti è rara. I fattori ambientali che influenzano la distribuzione delle specie sono molteplici e combinati fra loro,... - PowerPoint PPT Presentation

Transcript of Caratteristiche dei dati ecologici

  • Caratteristiche dei dati ecologiciI dati sono sparsi, cio hanno molti valori nulli (a volte la maggioranza!)La gran parte delle specie presenti rara.I fattori ambientali che influenzano la distribuzione delle specie sono molteplici e combinati fra loro,......ma quelli veramente importanti sono pochi (bassa dimensionalit intrinseca).I dati contengono molto rumore sia per eventi stocastici e contingenti, sia per lerrore di osservazione (anche in condizioni ideali le repliche sono diverse!)Linformazione spesso ridondante (la specie A associata alla specie B, ma questa pu essere associata alla specie C, etc.): questo un problema, ma anche ci che rende possibile interpretare i dati ecologici.

  • Gradienti ambientali e cenocliniScala dello studio

  • La cassetta degli attrezzi.Ordinamento (PCA, MDS, NMDS, CA, DCA, CCA, etc.)Classificazione (algoritmi gerarchici, k-means, reti neuronali, etc.)Analisi spaziale (correlogrammi, variogrammi, kriging, co-kriging, etc.)Analisi di serie (periodogrammi, runs tests, cross-correlation, cross-association, etc.)Confronti fra dati multivariati (MRPP, test di Mantel, INDVAL, etc.)Reti neurali...

  • Tecniche di ordinamentotre speciedue dimensioni

  • Analisi indiretta di gradienteMetodi basati su distanzeOrdinamento polare (Bray-Curtis) Analisi delle Coordinate Principali (PCoA)Multidimensional Scaling Nonmetrico (NMDS)Metodi basati su autovalori/autovettoriModello lineareAnalisi delle Componenti Principali (PCA)Modello unimodaleAnalisi delle Corrispondenze (CA)Analisi delle Corrispondenze Detrendizzata (DCA)

  • PCoA e NMDSdue dimensionin dimensioniabcdefabcdef

    abcdefa0.0000.3170.4050.9820.9230.829b0.3170.0000.1840.6170.6950.534c0.4050.1840.0000.5710.6140.773d0.9820.6170.5710.0000.0920.489e0.9230.6950.6140.0920.0000.391f0.8290.5340.7730.4890.3910.000

  • Stress elevato: distanze nellordinamento diverse da quelle originali, quindi bassa qualit dellordinamentoStress modesto: distanze nellordinamento simili a quelle originali, quindi alta qualit dellordinamento

  • 64

    ABCDEA010131423B1005815C13501320D1481309E23152090

  • PCooA

  • PCA

  • tre dimensionidue dimensioni

  • Asse MaggioreSi minimizza la somma dei quadrati delle proiezioni dei punti sullAsse MaggioreIl calcolo implica:Estrazione di autovalori ed autovettori dalla matrice di covarianzaoppureCalcolo delle regressioni Y su X e X su Y e della bisettrice delle due retted1d3d2d4d5d6d7d8Asse maggiore

  • PCA

  • Perch lordinamento?"Ordination primarily endeavors to represent sample and variable relationships as faithfully as possible in a low-dimensional space.

    Gauch (1982)

  • La PCA una rotazione rigida degli assi: non cambia le posizioni degli oggetti nel loro spazio, ma ridefinisce il sistema di coordinate.Nella PCA gli assi sono definiti in modo che le distanze di ciascun oggetto dagli assi sia minimizzata (come nel caso dellasse maggiore).Gli assi sono combinazioni lineari delle variabili originali.In queste combinazioni lineari ogni variabile ha un peso (loading) noto e interpretabile.La PCA accetta valori negativi per le variabili analizzate.La PCA consente di proiettare nuovi punti in un ordinamento

  • La PCA adatta a trattare variabili dimensionalmente eterogenee, che possono essere standardizzate in modo da avere media nulla e varianza unitaria (in questo caso si lavora sulla matrice di correlazione)Gli autovalori hanno un significato legato alla varianza spiegata da ciascun asse e la loro somma corrisponde alla somma delle varianze di tutte le variabili (o al numero di variabili in caso di varianza unitaria).Gli assi sono linearmente indipendenti fra loro (ortogonali), cio la somma dei prodotti dei pesi delle variabili che definiscono due diversi assi nulla.La PCA ha seri problemi ad analizzare dati la cui distribuzione non sia normale, ma soprattutto non pu rendere conto correttamente di relazioni fortemente non lineari o addirittura non monotone.

  • Pearson sviluppa la PCA come una tecnica di regressione (quindi basata sulla covarianza)

    Hotelling sviluppa la PCA come metodo per analizzare e comprendere il significato delle matrici di correlazione

    1954Goodall usa il termine ordinamento (ordination) per la PCA

  • LLINVQUADEXP1-510250.012-49160.023-3890.054-2740.145-1610.3760501.0071412.7282347.39932920.0910411654.60115025148.41

  • PC1PC2PC3L0.575-0.3000.281LINV-0.5750.300-0.281QUAD0.1930.8420.504EXP0.5480.334-0.767

    autovalorevarianza spiegataPC12.65866.5%PC21.23230.8%PC30.1102.8%

  • PC1PC2PC31-1.7632.2140.3482-1.5951.1660.0123-1.3840.310-0.2114-1.129-0.356-0.3205-0.827-0.830-0.3186-0.477-1.110-0.2097-0.070-1.192-0.00580.419-1.0590.26191.054-0.6750.498102.0100.0700.461113.7631.463-0.517

  • r

  • Dati centratiDati standardizzatiSi\SiSi\NoNo\SiNo\Nox=(x-m)/sx=x-mx=x/sx=x

  • CA

  • Analisi diretta di gradienteModello lineareAnalisi di Ridondanza (RDA)Modello unimodaleAnalisi Canonica delle Corrispondenze (CCA)Analisi Canonica delle Corrispondenze Detrendizzata (DCCA)

  • CCA

  • Mostrare esempi (INDVAL, MRPP, etc.)