Seminario VII

16
Seminario VII: Tablas de contingencia y asociación entre variables. CELIA GÁLVEZ LÓPEZ

Transcript of Seminario VII

Page 1: Seminario VII

Seminario VII: Tablas de contingencia y asociación entre variables. CELIA GÁLVEZ LÓPEZ

Page 2: Seminario VII

Ejercicio 1 Si queremos conocer si existe asociación entre el consumo de tabaco y

el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que: De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al

nacer. De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso

al nacer.

1. Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes

2. Establece una hipótesis adecuada para el estudio3. Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesis4. Calcula la odds ratio5. Repite el ejercicio con R Commander ¿Los resultados son los mismos?

Page 3: Seminario VII

1.1 Representa los datos en una tabla de contingencia indicando las frecuencias observadas y porcentajes.

V1= mujeres

V2= peso al nacer

Sin bajo pesos Con bajo peso Total

Mujer fumadora 43 207 250% Mujer fumadora 17,2 82,8 100

Mujer no fumadora 105 1645 1750% Mujer no fumadora 6 94 100

Total 148 1852 2000Total % 7,4 92,6 100

Page 4: Seminario VII

1.2 Establece una hipótesis adecuada para el estudio.

¿Existe relación entre el consumo de tabaco en mujeres y la probabilidad de tener un hijo con bajo peso al nacer?

Ho: No existe relación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los hijos.

H1: Sí existe relación entre el consumo de tabaco en mujeres y el bajo peso al nacer de los hijos.

Page 5: Seminario VII

1.3 Utiliza la prueba Chi-cuadrado de Pearson para contrastar tu hipótesis.

𝑋 2=∑ ( 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠− 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 )2

𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠 =(43−18,5)2

18,5+

(207−231,5)2

231,5+(105−129,5)2

129,5+(1645−1620,5)2

1620,5=40,04436402

Cálculo de las frecuencias esperadas

Page 6: Seminario VII

Ahora necesitamos saber los grados de libertad, que se calculan multiplicando el número de filas menos 1 y el número de columnas menos 1, por tanto:

En este caso al encontrarnos ante una variable con dos variables, dicotómicas, nos quedaría (2-1)*(2-1)= 1.

Teniendo en cuenta el X2 teórico = 3.8415, podremos decir que como X2 real = 40,044 es > X2 teórico = 3,8415 tendríamos que rechazar nuestra Ho y por consiguiente existe relación entre el consumo de tabaco en mujeres y el bajo peso de sus hijos al nacer.

Page 7: Seminario VII

1.4 Calcula la Odds Ratio

En nuestro caso, la Odds Ratio es mayor a 1, por tanto, la presencia de dicho factor se asocia a una mayor ocurrencia del evento (hijos con bajo peso).

Page 8: Seminario VII

1.5 Realizar los ejercicios anteriores en R

Page 9: Seminario VII

Para ello nos dirigimos a “Estadísticos”, ·Tablas de contingencia” e “Introducir y analizar una tabla de doble entrada”.

Introducimos los valores en la tabla en relación a los datos de nuestro ejercicio.Le damos a “Estadísticos y seleccionamos para que nos haga el test de Fisher

Page 10: Seminario VII

Nos aparecerá en la ventana inferior de R Commander los valores de Chi-Cuadrado y la “p”, junto con el resultado del test de Fisher y la Odds de Ratio

Frecuencias esperadas

Valores de “p” y X2

Page 11: Seminario VII

Observamos como los valores de X2 = 40,044, de “p”, Frecuencias Esperadas, test de Fisher y Odds de Ratio son similares a los ejercicios realizados anteriormente.

Page 12: Seminario VII

Ejercicio 2

Siguiendo todos los pasos anteriores establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y: Practicadeporte (Sí, No) Fruta: 1- “Nunca o casi nunca”, 2- “Menos de una vez por

semana”, 3-“Una o dos veces a la semana”, 4- “Tres o más veces a la semana”, 5 “A diario”

Page 13: Seminario VII

Una vez que hayamos cambiado el directorio de trabajo y cargado el conjunto de datos, realizaremos una tabla de contingencia por lo que vamos a “Estadísticos”, “Tablas de contingencia” y “Tabla de doble entrada…”

Luego seleccionamos nuestras 2 variables que son “sexo” y “practicadeportiva”.

Page 14: Seminario VII

Como podemos observar, X2 real = 19,163 y por tanto es mayor que la teórica que es 3,8415, por lo que rechazamos la Ho y aceptamos la alternativa, por consiguiente podemos afirmar que las variables “sexo” y “practicadeportiva” presentan asociación

Page 15: Seminario VII

Ahora procedemos a hacer el mismo ejercicio anterior pero con la variable “sexo” y “fruta”

Page 16: Seminario VII

En esta ocasión en los resultados podemos observar que la X2 real = 7,6036 y por tanto mayor que la teórica que es 3,8415, por lo que rechazamos la Ho y aceptamos la alternativa, por consiguiente podemos afirmar que las variables “sexo” y “fruta” presentan asociación