curso de estadística a distancia el profesor se va por las ramas… los alumnos parecen ausentes…
Post on 25-Jan-2016
217 Views
Preview:
TRANSCRIPT
Curso de Estadísticaa Distancia
El Profesor se va por las ramas…Los alumnos parecen ausentes…
Contraste de Ajuste
• Se efectúan sobre la forma de la distribución supuestamente generadora de los datos.
• Contrástes Básicos– Chi2 de Pearson– Kolmogorov-Smirnov
• Bases:– Cálculo de un estadístico que posee una distribución conocida, sobre la base de una muestra.
– Verificación de probabilidades. Región Crítica.
Cont. Ajuste Chi2
• Sea una muestra x1, ..,xn, de una variable discreta que se puede acomodar en frecuencias (O1,…,Ok).
• Bajo hipótesis nula cada valor de la variable X poseerá una frecuencia esperada.
• Si la probabilidad de Xi es pi, la frecuencia esperada será npi
Cont. Ajuste Chi2
Cont. Ajuste Chi2
• El estadistico es
• y posee distribución 2 con m grados de libertad, donde:
• m= k-1 si las probabilidades pi son especificadas a priori de la muestra.
• m= k-r-1 si el modelo es especificado sobre la base de estimar por MV r parámetros a partir de la muestra.
k
i EiEiOi
X1
22 )(
Cont. Ajuste Chi2
• Si X2 > 2crítico se rechaza la hipótesis
nula.
Cont. Ajuste Chi2
Cont. KS
• Se aplica únicamente a variables continuas.
• Se ordena la muestra X de menor a mayor
• x(1) <= x(2) <= x(3) <=…<= x(n)
• se construye la función empírica de la muestra
)(
)1()(
)1(
1
/
0
)(
n
rr
xx
xxxnr
xx
xFn
Cont. KS
0.00 10.00 20.00 30.00 40.00 50.00
Valores observados
0.00
0.25
0.50
0.75
1.00
Dis
trib
uci
ón
em
pír
ica
Distribución empírica
Cont. KS
• Sea H0=F(x)=Fn(x)
F(x) modelo propuestoFn(x) distribución empírica
• Se calculaDn=máx|Fn(x)-F(x)|
• La distribución de Dn, bajo H0 es conocida (tabulada).
• Si Dn>Dcrítico la H0 se rechaza.
Cont. KS
Cont.Shapiro y Wilks
• Mide el ajuste de la muestra a una recta al dibujar la distribución empírica en un papel de probabilidad normal
Contrastes de Ajuste
Chi2 para Independencia
Análisis de Tablas de Contingencia
• Interrogantes:• Es posible modelar la generación de viajes solo por tamaño de familia, o debe incluirse los ingresos?
IngresosTamaño de la Familia
menos de 400
400 a 1000
mas de 1000
1 y 2 15 62 123 y 4 47 174 31mas de cuatro 22 112 25
Cantidad de viajes
Probabilidad Conjunta
Viajes realizados al área central por díaNinguno 1 2 3 o más
Posesión de Vehiculos 0 1 2 3Si 1 6 26 34 18No 2 6 25 20 15
Total 150Si 40%No 60%
01
23
1
2
0
10
20
30
40
Viajes al Area Central
1
2
Funciones de Probabilidad Conjunta
Cont. Chi2 Independencia
• Dada una tabla de contingencia (en una visión de probabilidad conjunta), bajo la hipótesis de independencia la probabilidad de cada celda es la multiplicación de las probabilidades marginales.
• Ejemplo:
Cont. Chi2 Independencia
Y1 Y2 Total P marginalX1 10 30 40 0.2X2 110 50 160 0.8Total 120 80 200P marginal 0.6 0.4
Probabilidades bajo independenciaY1 Y2
X1 0.6 * 0.2=0.12 0.4 * 0.2=0.08X2 0.6 * 0.8=0.48 0.4 * 0.8=0.32
EstimadasY1 Y2
X1 24 16X2 96 64
Cont. Chi2 Independencia
X2= (10-24)2/24+(30-16)2/16+(110-96)2/96+(50-64)2/64 = 25,5
2(r-1)x(c-1), 5% = 3,84
X2> 2critico, se rechaza la hipótesis de
independencia.ProbabilidadesY1 Y2
X1 25.0% 75.0% 100%X2 68.8% 31.3% 100%
ChancesY1
X1 0.333 De 0,333 a 1X2 2.200 De 2,2 a 1
Otros Test de Análisis de Tablas de Contingencia
• Test Chi2 de Fisher (distribución exacta)
• Test de Mantel-Haenszel• MH con corrección de Yates• etc
• Test para variables nominales (datos categóricos)
• Test para (datos ordinales)
Tablas de Contingencia 2x2
• Relación de Chances (Odds Ratio)• Producto cruzado
• Interrogante:• ¿Se puede decir que la probabilidades de obtener “esquina” o “Centro” son distintas en Modelo 1 que en modelo”?¿o es sólo producto del azar?
Ejemplo 1 Ejemplo 2VAR 2 VAR 4
VAR 1 Gris Blanco VAR3 Esquina CentroRojo 60 20 Modelo Uno 800 200Verde 45 15 Modelo Dos 450 150
top related