Covarianza 123

download Covarianza 123

of 13

Transcript of Covarianza 123

  • 8/17/2019 Covarianza 123

    1/13

    Covarianza

    La covarianza  de una variable bidimensional es la media aritméticade los productos de las desviaciones de cada una de las variables

    respecto a sus medias respectivas.

    La covarianza  se representa por  sxy o σxy.

    La covarianza  indica el sentido de la correlación entre las variables

    Si σxy > 0 la correlación es directa.

    Si σxy < 0 la correlación es inversa.

    La covarianza  presenta como inconveniente, el hecho de que suvalor depende de la escala elegida para los ejes.

    Es decir, la covarianza variará si expresamos la altura en metros oen centímetros. ambién variará si el dinero lo expresamos en euroso en dólares.

    Ejemplos:

    Las notas de !" alumnos de una clase en #atemáticas $ %ísica son lassiguientes&

    Matemáticas Física

    2 1

    3 3

    2

  • 8/17/2019 Covarianza 123

    2/13

    !

    "

    " "

    #

    # "

    $ #

    10 %

    10 10

    'allar la covarianza de la distribución.

    xi yi xi & yi

    2 1 2

    3 3 %

    2 $

    1"

    5 4 20

    6 4 24

    6 6 36

    7 4 28

    7 6 42

  • 8/17/2019 Covarianza 123

    3/13

    8 7 56

    10 9 90

    10 10 100

    72 60 431

    (espués de tabular los datos hallamos las me'ias aritm(ticas &

    Los valores de dos variables ) e * se distribu$en seg+n la tablasiguiente&

    Y/X 0 2 4

    1 2 1 3

    2 1 4 2

    3 2 5 0

    'allar la covarianza  de la distribución.

    En primer lugar convertimos la tabla de doble entrada en tabla simple

    $ calculamos las medias aritméticas.

    xi yi f i xi · f i yi · f i xi · yi · f i

    0 1 2 0 2 0

    0 2 1 0 2 0

    http://www.vitutor.com/estadistica/descriptiva/a_10.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_10.html

  • 8/17/2019 Covarianza 123

    4/13

    0 3 2 0 6 0

    2 1 1 2 1 2

    2 2 4 8 8 16

    2 3 5 10 15 30

    4 1 3 12 3 12

    4 2 2 8 4 16

      20 40 41 76

    Coefciente de correlación lineal

    El coe)iciente 'e correlaci*n lineal es el cociente entre

    la covarianza $ el producto de las 'esviaciones típicas de ambas

    variables.

    El coe)iciente 'e correlaci*n lineal  se expresa mediante la letra r .

    +ropie'a'es

    1, El coe)iciente 'e correlaci*n  no varía al hacerlo la escala de

    medición.

    Es decir, si expresamos la altura en metros o en centímetros el

    coeiciente de correlación no varía.

    2, El signo del coe)iciente 'e correlaci*n es el mismo que el dela covarianza.

  • 8/17/2019 Covarianza 123

    5/13

    Si la covarian-a es positiva, la correlación es directa.

    Si la covarian-a es negativa, la correlación es inversa.

    Si la covarian-a es nula, no existe correlación.

    3, El coe)iciente 'e correlaci*n lineal es un n+mero realcomprendido entre ! $ !.

    -1 . r . 1

    , Si el coe)iciente 'e correlaci*n lineal  toma valores cercanos a! la correlación es )/erte e inversa, $ será tanto más uerte cuantomás se aproxime r a !.

    !, Si el coe)iciente 'e correlaci*n lineal  toma valores cercanos a !

    la correlación es )/erte y 'irecta, $ será tanto más uerte cuantomás se aproxime r a !.

    ", Si el coe)iciente 'e correlaci*n lineal  toma valores cercanos a/, la correlación es '(il.

    #, Si r 0 ! ó !, los puntos de la nube están sobre la recta crecienteo decreciente. Entre ambas variables ha$  'epen'encia )/ncional.

    Ejemplos:  

    Las notas de !" alumnos de una clase en #atemáticas $ %ísica son lassiguientes&

    Matemáticas Física

    2 1

    3 3

    4 2

    4 4

    5 4

    6 4

    6 6

    7 4

  • 8/17/2019 Covarianza 123

    6/13

    7 6

    8 7

    10

    10 10

    'allar el coe)iciente 'e correlaci*n de la distribución e

    interpretarlo.

    !i "i !i #"i !i2 "i2

    2 1 2 4 1

    3 3

    4 2 8 16 4

    4 4 16 16 16

    5 4 20 25 16

    6 4 24 36 16

    6 6 36 36 36

    7 4 28 4 16

    7 6 42 4 36

    8 7 56 64 4

    10 0 100 81

    10 10 100 100 100

    72 60 431 504 380

    1 'allamos las me'ias aritm(ticas .

    http://www.vitutor.com/estadistica/descriptiva/a_10.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_10.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_10.html

  • 8/17/2019 Covarianza 123

    7/13

    2 1alculamos la covarianza.

    3 1alculamos las 'esviaciones típicas.

     2plicamos la órmula del coe)iciente 'e correlaci*n lineal.

     2l ser el coe)iciente 'e correlaci*n positivo, la correlación es

    directa.

    1omo coe)iciente 'e correlaci*n está mu$ próximo a ! la

    correlación es mu$ uerte.

    Los valores de dos variables ) e * se distribu$en seg+n la tablasiguiente&

     $%& 0 2 4

    1 2 1 3

    2 1 4 2

    3 2 5 0

    'eterminar el coefciente de correlación(

    1onvertimos la tabla de doble entrada en tabla simple.

    !i "i ) i !i # ) i !i2 # ) i "i # ) i "i2 # ) i !i # "i # ) i

    0 1 2 0 0 2 2 0

    http://www.vitutor.com/estadistica/bi/covarianza.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_16.htmlhttp://www.vitutor.com/estadistica/bi/covarianza.htmlhttp://www.vitutor.com/estadistica/descriptiva/a_16.html

  • 8/17/2019 Covarianza 123

    8/13

    0 2 1 0 0 2 4 0

    0 3 2 0 0 6 18 0

    2 1 1 2 4 1 1 2

    2 2 4 8 16 8 16 16

    2 3 5 10 20 15 45 30

    4 1 3 12 48 3 3 12

    4 2 2 8 32 4 8 16

      20 40 120 41 7 76

     2l ser el coe)iciente 'e correlaci*n negativo, la correlación es

    inversa.

    1omo coe)iciente 'e correlaci*n está mu$ próximo a / lacorrelación es mu$ débil.

    'ia*rama de +,ntos3n diagrama de puntos es una gráica utili-ada para ilustrar un n+mero

    reducido de datos, la cual permite identiicar con acilidad dos características&

    !. La locali-ación de los datos.

    ". La dispersión o variabilidad de los datos.

  • 8/17/2019 Covarianza 123

    9/13

    Este diagrama muestra cada uno de los elementos de un conjunto de datos

    numéricos por encima de una recta numérica 4eje hori-ontal5, acilita la

    ubicación de los espacios vacíos $ los agrupamientos en un conjunto de datos,

    así como la manera en que estos datos se distribu$en a los largo del eje

    hori-ontal.

    -os .asos .ara constr,ir el dia*rama

    son/

    6aso 7 !& ra-ar una línea hori-ontal con el valor mínimo colocado en el

    extremo i-quierdo, seleccionar una escala $ utili-ando intervalos regulares,

    marcar la escala hasta que el valor máximo sea alcan-ado.

    6aso 7 "& 6ara cada valor numérico presente en la tabla de datos, colocar un

    punto sobre la escala de valores en la recta numérica, cuando el valor 

    numérico aparece más de una ve-, apilar los puntos.

    em.lo/

    La tabla siguiente muestra los datos de longitud en milímetros de un conjunto

    de cables que serán utili-ados en un estudio de resistencia a la tensión&

    Cale -on*it,

    d

    Cale -on*it,

    d

    Cale -on*it,

    d

    Cale -on*it,

    d

    1 20 6 40 11 40 16 40

    2 80 7 20 12 110 17 200

    3 110 8 20 13 120 18 10

    4 100 9 90 14 20 19 100

    5 80 10 80 15 40 20 150

     +aso 1& ra-ar una línea hori-ontal con el valor mínimo colocado en el

    extremo i-quierdo, seleccionar una escala $ utili-ando intervalos regulares,

    marcar la escala hasta que el valor máximo sea alcan-ado.

  • 8/17/2019 Covarianza 123

    10/13

     +aso 2: 6ara cada valor numérico presente en la tabla de datos, colocar un

    punto sobre la escala de valores en la recta numérica, cuando el valor

    numérico aparece más de una ve-, apilar los puntos.

    mportante: El diagrama de puntos es una representación de datos +til para

    muestras peque8as, hasta 4digamos5 unas "/ observaciones 4(ouglas 1.

    #ontgomer$, "//95.

    nálisis de re*resión linealEl objeto de un análisis de regresión es investigar la relación estadística

    que existe entre una variable dependiente 4Y 5 $ una o más

    variables independientes 4 , ... 5. 6ara poder reali-ar esta investigación, se

    debe postular una relación uncional entre las variables. (ebido a su simplicidad

    analítica, la orma uncional que más se utili-a en la práctica es la relación  lineal .

    1uando solo existe una variable independiente, esto se reduce a una línea recta&

  • 8/17/2019 Covarianza 123

    11/13

    (onde los coeicientes b/ $ b! son parámetros que deinen la posición e

    inclinación de la recta. 4:ótese que hemos usado el símbolo especial para

    representar el valor deY  calculado por la recta. 1omo veremos, el valor real de Y rara

    ve- coincide exactamente con el valor calculado, por lo que es importante hacer esta

    distinción.5

    El parámetro b/, conocido como la ;ordenada en el origen,; nos indica cuánto es Y 

    cuando X  0 /. El parámetro b!, conocido como la ;pendiente,; nos indica cuánto

    aumenta Y  por cada aumento de una unidad en X . :uestro problema consiste en

    obtener estimaciones de estos coeicientes a partir de una muestra de observaciones

    sobre las variables Y  $ X . En el análisis de regresión, estas estimaciones se obtienen

    por medio del método de mínimos cuadrados.

    1omo ejemplo, consideremos las ciras del 1uadro !, que muestra datos mensuales

    de producción $ costos de operación para una empresa británica de transporte depasajeros por carretera durante los a8os !9" 4la producción se mide en términos

    de miles de millas=vehículo recorridas por mes, $ los costos se miden en términos de

    miles de libras por mes5. 6ara poder visuali-ar el grado de relación que existe entre las

    variables, como primer paso en el análisis es

    conveniente elaborar un diagrama de

    dispersión, que es una representación en un

    sistema de coordenadas cartesianas de los datos numéricos observados. En el

    diagrama resultante, en el eje  X  se miden las millas=vehículo recorridas, $ en el

    eje Y  se mide el costo de operación mensual. 1ada punto en el diagrama muestra la

    pareja de datos 4millas=vehículo $ costos de operación5 que corresponde a un mesdeterminado. 1omo era de esperarse, existe una relación positiva entre estas

    variables& una ma$or cantidad de millas=vehículo recorridas corresponde un ma$or 

    nivel de costos de operación.

  • 8/17/2019 Covarianza 123

    12/13

  • 8/17/2019 Covarianza 123

    13/13

    o 1aso 2 = Elecciones en %lorida

    o 1aso @ Le$ de Jun& (esempleo $ 1recimiento Económico, 3S2

    !9AA=9>.

    o 1aso 1 Le$ de Jun& (esempleo $ 1recimiento Económico, 3S2

    !9"9=>