estadística descriptiva: 3. análisis bivariado ricardo Ñanculef alegría universidad técnica...
TRANSCRIPT
![Page 1: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/1.jpg)
Estadística Descriptiva:3. Análisis Bivariado
Ricardo Ñanculef AlegríaUniversidad Técnica Federico Santa María
![Page 2: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/2.jpg)
Estadística Descriptiva Objetivo
• Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia.
• Tipos de Análisis:
• Describir cómo se comporta una variable• Describir cómo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente)• Describir cómo interaccionan varias variables
![Page 3: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/3.jpg)
Estadística Descriptiva Objetivo
• Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia.
• Tipos de Análisis:
• Análisis Univariado• Análisis Bivariado• Análisis Multivariado
![Page 4: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/4.jpg)
Estadística Descriptiva Ejemplos de Análisis Bivariado
![Page 5: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/5.jpg)
Estadística Descriptiva Ejemplos de Análisis Bivariado
• Hipotesis Preliminar que Guía el Análisis: La probabilidad de muerte del feto en un embarazo se ve influenciada (aumenta) con el nivel de estrés de la madre.
• Posible experimento. 1. Tomamos una muestra de casos clínicos. 2. Separamos la muestra en dos grupos: (A) madres con estrés y (B) madres sin estrés. 3.Medimos la frecuencia de muertes en cada grupo4.Comparamos ambas frecuencias.
![Page 6: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/6.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Lo anterior es un ejemplo de Análisis Estratificado:
• Se divide una muestra de acuerdo al valor de una variable que llamaremos variable estratificadora X.• Se estudia el comportamiento de otra variable de interés Y en cada subgrupo o estrato. • Se da cuenta de cómo cambia el comportamiento de Y al cambiar de estrato X.
![Page 7: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/7.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• El análisis estratificado pretende mostrar cómo cambia una variable (Y) cuando cambia otra (X). • En el estudio con las embarazadas:
• Estratificadora (X): Presencia o ausencia de estrés.• Dependiente (Y): Presencia o no de muerte fetal.• Se determina cómo cambia el promedio de Y (tasa de muerte) cuando cambiamos de estrato.
![Page 8: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/8.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• ¿Qué tal si la hipótesis fuera?: “La probabilidad de muerte fetal depende del número de sueño de la madre en el período de gestación”.
• ¿Cómo estratificamos la muestra? El problema es que la variable explicativa (X=horas de sueño) es ahora continua.
![Page 9: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/9.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Idea: Si la variable explicativa es continua, definir categorías de valores posibles y separar la muestra de acuerdo a ellas.
• ¿Cómo determinar las categorías?:
• juicio o conocimiento previo: estrato económico, partido político, niveles normales/anormales. • criterio estadístico: como el utilizado construir histogramas (organizar por clases).
![Page 10: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/10.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas • Ejemplo: En la muestra se registraron las siguientes horas de sueño promedio durante los últimos 6 meses de gestación: 8.0, 8.5, 11.0, 6.5, 7.2, 6.2, 10.0, 10.5, 9.2, 9.5, 6.0, 7.2, 6.9, 6.4, 12.5, 10.8
con k = 3 R = 12.5 – 6.0 = 6.5A = (R + 1) / 3 = 2.5
Límites
5.5 - 8.08.0 - 10.510.5 – 13.0
Marca
6.759.25
11.75
Grupo
123
![Page 11: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/11.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Una vez que ya hemos estratificado con algún criterio:
E2E1
Em
¿qué medimos?
![Page 12: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/12.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Una vez que ya hemos estratificado con algún criterio: ¿qué medimos?: frecuencias.
• ¿Cuántas observaciones caen en cada estrato?: frecuencias absolutas (n1 , n2 , … , nm) ó relativas (p1 , p2 , … , pm )
• Estas últimas dan el peso del estrato en la muestra total
p2
p1
pm
![Page 13: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/13.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Una vez que ya hemos estratificado con algún criterio: ¿qué medimos?: tendencia.
• ¿Cuál es la tendencia en cada estrato?: media, mediana, etc.
2X
1X
mX
![Page 14: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/14.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Una vez que ya hemos estratificado con algún criterio: ¿qué medimos?: dispersión.
• ¿Cuál es la dispersión en cada estrato?: varianza, IQR
2V
1V
mV
![Page 15: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/15.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Una vez que ya hemos estratificado y analizado el comportamiento de la variables por estrato, es útil presentar las estadísticas de manera gráfica, e.g. box-plots.
![Page 16: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/16.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Box-plots por cada estrato
E1E2
E3
![Page 17: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/17.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Una forma de medir el efecto de la variable presuntamente explicativa (X) sobre la explicada (Y) es el Análisis de Varianza.
• Idea: si la presunta variable estratificadora X explica bien la otra variable Y, ésta última no debiera ser muy variable con X constante en comparación con el cambio observado al cambiar X
![Page 18: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/18.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Análisis de Varianza:
• Varianza Intra-Estratos: dentro de los grupos.
m
hhhVp
1
Varianza no explicada por la variable estratificadora
Ponderamos por el peso del estrato!!!
![Page 19: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/19.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Análisis de Varianza:
• Varianza Inter-Estratos: entre los grupos.
2
1
)(
m
h
hh YYp
Varianza explicada por la variable estratificadora
media de cada grupo inducido por la variable explicativa X
media total o promedio ponderado de las medias por grupo.
m
h
nhYpY1
![Page 20: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/20.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Análisis de Varianza:
• Varianza Inter-Estratos: entre los grupos.
2
1
)(
m
h
hh YYp
Varianza explicada por la variable estratificadora
Ponderamos por el peso del estrato!!!
![Page 21: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/21.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Análisis de Varianza:
• Varianza Muestral Total:
2
11
)(
m
h
hh
m
hhhT YYpVpV
2)(
1 I
iT YYn
V
interintra VVVT
Varianza Muestral Sin Estratificar
![Page 22: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/22.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Análisis de Varianza:
• Cuociente de Varianza Explicada:• Medida de la calidad de la variable estratificadora X como variable explicativa para Y • Para todo lo anterior necesitamos que Y sea continua, pero X puede ser continua o discreta, numérica o cualitativa.
inter/VVT
![Page 23: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/23.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Consideremos la siguiente hipótesis de estudio: Caminar ayuda a mantener un índice de grasa corporal adecuado.
![Page 24: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/24.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Para validar la hipótesis se tomó una muestra de 16 hombres, encuestándolos acerca del número de horas caminadas a la semana y midiendo su % de grasa corporal. La muestra es la siguiente:
![Page 25: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/25.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
horas (H) % grasa (G) horas (H) % grasa (G)
4 18.9 2 22.5
1.5 24.8 6.5 18.0
5 17.5 0.5 27.2
1 26.2 0.9 25.5
4.2 18.2 3 20.8
6 18.4 5 21.8
2.5 21.4 4 22.6
7 17.4 3.5 21.0
3875.21G7898.9TV
![Page 26: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/26.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Decidimos estratificar la muestra de acuerdo al número de horas caminadas, considerano 3 clases para el conjunto de valores de esta variable:
R = (7-0.5) = 6.5A = (R + 1)/3 = 2.5
clase Límites frecuencia
1 (0, 2.5] 0.3750
2 (2.5, 5] 0.4375
3 (5, 7.5] 0.1875
![Page 27: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/27.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Estratificamos por cada clase de valores para la variable “horas caminadas” generandose 3 submuestras
1.5 24.8
1 26.2
2.5 21.4
2 22.5
0.5 27.2
0.9 25.5
Estrato 1
4 18.9
5 17.5
4.2 18.2
3 20.8
5 21.8
4 22.6
3.5 21.0
Estrato 2
6 18.4
7 17.4
6.5 18.0
Estrato 3
![Page 28: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/28.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Medimos las medias y las varianzas por estrato:
clase límites frecuencia media varianza
1 (0, 2.5] 0.3750 24.60 4.1367
2 (2.5, 5] 0.4375 20.11 3.1784
3 (5, 7.5] 0.1875 17.93 0.1689
![Page 29: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/29.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Calculamos las varianzas intra e inter
0.16890.18753.17840.43754.13670.375intra V
clase límites frecuencia media varianza
1 (0, 2.5] 0.3750 24.60 4.1367
2 (2.5, 5] 0.4375 20.11 3.1784
3 (5, 7.5] 0.1875 17.93 0.1689
9735.2intra V
![Page 30: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/30.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:Calculamos las varianzas intra e inter
)G-(17.930.1875
)G-(20.110.4375)G-(24.600.375inter
V
clase límites frecuencia media varianza
1 (0, 2.5] 0.3750 24.60 4.1367
2 (2.5, 5] 0.4375 20.11 3.1784
3 (5, 7.5] 0.1875 17.93 0.1689
3875.21G8255.6inter V
![Page 31: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/31.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Ejemplo de Análisis de Varianza:
Corroboramos la descomposición propuesta:
% de varianza explicada (fracción del cambio en el índice de grasa que explica o predice el número de horas caminadas)
8255.6inter V
9735.2intra Vinterintra7898.9 VVVT
6966.0/inter TVV %)70( Hay una relación bien significativa
![Page 32: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/32.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• ¿Es valida la relación entre las varianzas cuando estas se calculan normalizando la suma de cuadrados por n-1 en vez de n?
![Page 33: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/33.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Cuando entremos en Estadística Inferencial justificaremos porqué es más útil y correcto comparar las sumas de cuadrados
2)(
IiT YYS
m
k Eiki
k
YYS1
2intra )(
m
kkk YYnS
1
2inter )(
Número de observaciones en el estrato k
Suma sobre los estratos
Suma sobre las observaciones del estrato k
![Page 34: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/34.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• ANOVA (Análisis de Varianza)Comparamos la variabilidad intra versus la inter
De acuerdo al valor de F podemos aseverar que la variable estratificadora induce cambios en la otra variable con una significancia estadística α
m-n
1intra
inter
SmS
F Estadístico F de Fisher(m: número de clases)
![Page 35: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/35.jpg)
Análisis de Contingencia o Correspondencia
• Dadas dos variables X, Y dividir los posibles valores de X en k grupos y los posibles valores de Y en s grupos. • Determinar luego las frecuencias conjuntas de cada par formado por uno de los grupos de X y uno de los grupos para Y: con qué frecuencia las observaciones caen en un grupo X y un grupo Y simultáneamente.
![Page 36: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/36.jpg)
Análisis de Contingencia o Correspondencia
Y: B1 B2 … Bs
X: A1
A2
… Ar
Grupos de valores para Y
Grupos de valores para X
![Page 37: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/37.jpg)
Análisis de Contingencia o Correspondencia
Frecuencia con que en la muestra aparecen observaciones que caen en la categoría i de acuerdo al valor de X y en la categoría j de acuerdo al valor de Y
B1 B2 ..... Bj ..... Bs
A1 n11 n12 ..... n1j ..... n1s
A2 n21 n22 ..... n2j ..... n2s
Ai ni1 ni2 ..... nij ..... nis
Ar nr1 nr2 ..... nrj ..... nrs
![Page 38: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/38.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Marginales:
Cuando interesa la frecuencia de una de las variables independiente de lo que pase con la otra hablamos de Frecuencia Marginal de la variable X ó Y
![Page 39: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/39.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Marginales por Clases de X
B1 B2 ..... Bj ..... Bs Total
A1 n11 n12 ..... n1j ..... n1s n1
A2 n21 n22 ..... n2j ..... n2s n2
Ai ni1 ni2 ..... nij ..... nis ni
Ar nr1 nr2 ..... nrj ..... nrs nr
![Page 40: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/40.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Marginales por Clases de Y
B1 B2 ..... Bj ..... Bs Total
A1 n11 n12 ..... n1j ..... n1s n1
A2 n21 n22 ..... n2j ..... n2s n2
Ai ni1 ni2 ..... nij ..... nis ni
Ar nr1 nr2 ..... nrj ..... nrs nr
Total n1 n2 ..... nj ..... ns n
n = n_
![Page 41: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/41.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Marginales:
s
jiji nn
1
Frecuencia Absoluta de la clase Ai; i = 1, ,2, ... ,rFrecuencias Independientes de la clases Bj a la que estén asociadas: suma de los valores de la fila i-ésima
r
iijj nn
1
Frecuencia Absoluta de la clase Bj; j= 1, ,2, ... ,sFrecuencias Independiente de las clases Ai a la que estén asociadas: suma de los valores de la columna j-ésima
![Page 42: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/42.jpg)
Análisis de Contingencia o Correspondencia
• Tabla de Contingencia con Frecuencias Relativas B1 B2 ..... Bj ..... Bs Total
A1 f11 f12 ..... f1j ..... f1s f1
A2 f21 f22 ..... f2j ..... f2s f2
Ai fi1 fi2 ..... fij ..... fis fi
Ar fr1 fr2 ..... frj ..... frs fr
Total f1 f2 ..... fj ..... fs f
fij nijn
![Page 43: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/43.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Relativas Marginales: Análogo al caso de frecuencias absolutas.
s
jiji ff
1
Frecuencia Relativa de la clase Ai; i = 1, ,2, ... ,rsuma de los valores de la fila i-ésima de la tabla de frecuencias relativas conjuntas
r
iijj ff
1
Frecuencia Relativa de la clase Bj; j= 1, ,2, ... ,ssuma de los valores de la columna j-ésima de la tabla de frecuencias relativas conjuntas
![Page 44: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/44.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Condicionales:
Las frecuencias condicionales de una clase Ai (asociada a X) dado un grupo Bj (asociado a Y) corresponden a la proporción de casos de Bj en que se observa Ai
j
ij
j
ijji f
fnn
f
/
![Page 45: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/45.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Condicionales:
Las frecuencias condicionales de una clase Bj (asociada a Y) dado un grupo Ai (asociado a X) corresponden a la proporción de casos de Ai en que se observa Bj
i
ij
i
ijij f
fnn
f
/
![Page 46: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/46.jpg)
Análisis de Contingencia o Correspondencia
• Ejemplo
Se tiene la siguiente sospecha: “El consumo de sal sube la presión arterial”. Para ello se toma una muestra de pacientes a quienes se les hace un seguimiento, midiendo ambas variables
X: cucharas de sal consumidas en la semanaY: presión arterial media en la semana
Después de un análisis se decide dividir la variable X en 3 intervalos: bajo, medio, alto. Análogamente, la variable Y se divide en tres intervalos que asociamos a: baja, normal, alta.
![Page 47: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/47.jpg)
Análisis de Contingencia o Correspondencia
• Ejemplo
Después de un análisis se decide dividir la variable X en 3 intervalos: bajo, medio, alto. Análogamente, la variable Y se divide en tres intervalos que asociamos a: baja, normal, alta. Las frecuencias conjuntas en la muestra son las sgtes:
Baja Normal Alta
Bajo 8 8 4
Medio 5 15 5
Alto 1 5 20
X: C
onsu
mo
de S
al
Y: presión arterial
![Page 48: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/48.jpg)
Análisis de Contingencia o Correspondencia
• Ejemplo
Las frecuencias conjuntas en la muestra son las sgtes:
Baja Normal Alta
Bajo 8 8 4
Medio 5 15 5
Alto 1 5 20
X: C
onsu
mo
de S
al
Y: presión arterial
![Page 49: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/49.jpg)
Análisis de Contingencia o Correspondencia
• Ejemplo
Las frecuencias marginales son las sgtes:
Baja Normal Alta
Bajo 8 8 4 20
Medio 5 15 5 25
Alto 1 5 20 26
14 28 29 71
X: C
onsu
mo
de S
al
Y: presión arterial
![Page 50: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/50.jpg)
Análisis de Contingencia o Correspondencia
• Ejemplo
Las frecuencias relativas son las sgtes:
Baja Normal Alta
Bajo 8/71 8/71 4/71 20/71
Medio 5/71 15/71 5/71 25/71
Alto 1/71 5/71 20/71 26/71
14/71 28/71 29/71 1
X: C
onsu
mo
de S
al
Y: presión arterial
![Page 51: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/51.jpg)
Análisis de Contingencia o Correspondencia
• EjemploCondicionando a la variable X (consumo de sal)Las frecuencias condicionales son las sgtes:
Baja Normal Alta
Bajo 8/20 8/20 4/20 1
Medio 5/25 15/25 5/25 1
Alto 1/26 5/26 20/26 1
X: C
onsu
mo
de S
al
Y: presión arterial
![Page 52: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/52.jpg)
Análisis de Contingencia o Correspondencia
• EjemploCondicionando a la variable X (consumo de sal)
0
0,1
0,2
0,3
0,4
0,5
X: Bajo X: Medio X: Alto
0,6
0,7 Observamos un claro cambio de la distribución de la presión de acuerdo al consumo de sal
![Page 53: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/53.jpg)
Análisis de Contingencia o Correspondencia
• Frecuencias Condicionales: Proporcionan una forma de medir la influencia de la variable X sobre la variable Y (o viceversa)
• Notar que las frecuencias se normalizan por un número más reducido de casos, que corresponden a los casos en que se observa el condicionante.
![Page 54: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/54.jpg)
Análisis de Contingencia o Correspondencia
• Independencia:Diremos que X es independiente de Y si las frecuencias condicionales de X a las diferentes clases de Y son todas iguales; es decir, no dependen de la clase condicionante
siii fff /2/1/ i
![Page 55: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/55.jpg)
Análisis de Contingencia o Correspondencia
• Independencia:Diremos que Y es independiente de X si las frecuencias condicionales de Y a las diferentes clases de X son todas iguales; es decir, no dependen de la clase condicionante
rjjj fff /2/1/ j
![Page 56: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/56.jpg)
Análisis de Contingencia o Correspondencia
• Observación 1: Si X es independiente de Y
• Similarmente, si Y es independiente de X
• Demostración?
isiii ffff /2/1/ i
iji ff / ji,
jij ff / ji,
![Page 57: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/57.jpg)
Análisis de Contingencia o Correspondencia
• Demostración:
isiii ffff 21
ssiiii fffffff /22/11/
)( 21/ sjii fffff
jii ff /
j
ij
j
ijji f
fnn
f
/
=
![Page 58: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/58.jpg)
Análisis de Contingencia o Correspondencia
• Observación 2: Si X es independiente de Y
• Demostración
jiij fff
jijjiij fffff /j
ij
j
ijji f
fnn
f
/ ji,
![Page 59: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/59.jpg)
Análisis de Contingencia o Correspondencia
• Observación 3: Si X es independiente de Y entonces Y es independiente de X
• Demostración
j
j
ij
ij
i
ijij f
ff
fff
f
/ji,
![Page 60: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/60.jpg)
Análisis de Contingencia o Correspondencia
• Información Mutua
• Si aceptamos la tabla de contingencia como una distribución aproximada podemos computar la información mutua de X e Y
ji
ij
JIij ff
ffYXI log),(
,
![Page 61: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/61.jpg)
Análisis de Contingencia o Correspondencia
• Información Mutua
• Si X es independiente de Y, I=0• Si X = Y, I es equivalente a la entropía de X
ji
ij
JIij ff
ffYXI log),(
,
![Page 62: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/62.jpg)
Análisis de Contingencia o Correspondencia
• Distancia entre las condicionales
• Una forma intuitiva de cuantificar el cambio que induce una variable en la otra es medir las distancias entre las condicionales considerandolas vectores
2/1/2/1/ ),( iiii ffffd
![Page 63: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/63.jpg)
Análisis de Contingencia o Correspondencia
• Al igual que antes es útil analizar la relación entre las variables de manera gráfica.
• Se presentan las frecuencias de una variable (digamos Y), por cada clase de la otra (X)
• También es posible mostrar las frecuencias condicionales en vez de las frecuencias relativas
![Page 64: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/64.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Histogramas por clase
0
0,1
0,2
0,3
0,4
0,5
Clase 1 (Y)
Clase 2 (Y)
Clase 3 (Y)
X: Clase 1 X: Clase 2 X: Clase 3 X: Clase 4
FrecuenciasRelativas
![Page 65: Estadística Descriptiva: 3. Análisis Bivariado Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María](https://reader033.vdocuments.pub/reader033/viewer/2022061613/5528bde2497959977d8f88aa/html5/thumbnails/65.jpg)
Estadística Descriptiva Análisis de Muestras Estratificadas
• Histogramas por clase (apilados)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
X: Clase 1 X: Clase 2 X: Clase 3 X: Clase 4
Clase 1 (Y)
Clase 2 (Y)
Clase 3 (Y)