inferencia estadística

44
Concepción San Luis La inferencia estadística Conceptualización actual. El hito de 1995

Upload: elisami

Post on 04-Jan-2016

214 views

Category:

Documents


0 download

DESCRIPTION

Explicación de la inferencia estadística del estudio psicológico.

TRANSCRIPT

Page 1: INFERENCIA estadística

Concepción San Luis

La inferencia estadística Conceptualización actual.

El hito de 1995

Page 2: INFERENCIA estadística

Concepción San Luis

LA INFERENCIA CLÁSICA.

CONCEPTOS BÁSICOS

Page 3: INFERENCIA estadística

Concepción San Luis

Distribución Normal

Page 4: INFERENCIA estadística

Concepción San Luis

Conceptos

• Estadístico

• Parámetro

• Muestra

• Distribución Muestral de un Estadístico

Page 5: INFERENCIA estadística

Concepción San Luis

DISTRIBUCIÓN MUESTRAL DE UN

ESTADÍSTICO

Supongamos que de una población determinada extraemos, al azar, infinitas muestras todas de tamaño n.

De cada muestra calculamos el valor de un estadístico (proporción, media, etc.).

Se llama distribución muestral al conjunto formado por los valores del estadístico seleccionado, obtenido para cada una de las muestras extraigas de la población.

Page 6: INFERENCIA estadística

Concepción San Luis

Inferencia: Distribución muestral

Parámetros

media:

Varianza σ2θ

Page 7: INFERENCIA estadística

Concepción San Luis

Principales distribuciones muestrales

• ProporcionesMedia:Error típico:

N desconocida

N conocida

• Medias:Media

Error típico:N desconocida

N conocida

p

np

1

1

1

N

nN

np

x

nx

1

N

nN

nx

Page 8: INFERENCIA estadística

Concepción San Luis

Parámetro y Estimador

• Parámetro: Característica descriptiva de la población.

• Estadístico: Propiedad descriptiva de una muestra que no es más que una combinación determinada de los valores de la/s variables.

• Un Estadístico permite “estimar” el valor del parámetro aunque nunca dará su valor exacto.

Page 9: INFERENCIA estadística

Concepción San Luis

Estimación Puntual

• Se toma como valor del Parámetro el calculado por el estadístico o estimador muestral.

• Toda función de distribución de una variables viene caracterizada por la variable a la que se refiere y uno o más parámetros que la definen.

Si F (x; β) es una función de distribución que depende del parámetro β que no conocemos, si para estimarlo empelamos un estadístico, dicho estadístico es un estimador de β, que representaremos por b.

Puesto que b es una función de los valores X de la muestra, que son variables aleatorias, b será también una variable aleatoria.

Page 10: INFERENCIA estadística

Concepción San Luis

¿Son todos los estadísticos buenos estimadores de sus correspondientes parámetros?.

¿Cómo se calculan los estimadores?

Page 11: INFERENCIA estadística

Concepción San Luis

Características de un buen estimador

• Carencia de sesgo:

Valor esperado coincide con el parámetro

• Consistencia: a medida

Aumente n

• Eficiencia:

Varianza máxima

• Suficiencia

Utiliza toda la

información

ˆE

1ˆ p

21ˆˆ VarVar

Page 12: INFERENCIA estadística

Concepción San Luis

Métodos de obtención de Estimadores

Hay muchos, pero los de interés son• Mínimos cuadrados: Selecciona como e timador

el que hace mínimo el error entre el valor real y el que predicho.

• Máxima Verosimilitud: Selecciona como estimador aquel que maximiza la probabilidad de la muestra observadaSon los que se utilizan en los procedimientos de análisis más habituales en Ciencias Sociales

Page 13: INFERENCIA estadística

Concepción San Luis

ESTIMACIÓN POR INTERVALOS

Page 14: INFERENCIA estadística

Concepción San Luis

Estimación por intervalos

Intervalo de probabilidad

(único)

Población Muestra

Parámetro Estadístico

p

Intervalo de confianza

(tantos como muestras)

Muestra Población

Estadístico Parámetro

p x x

Page 15: INFERENCIA estadística

Concepción San Luis

Intervalo de probabilidad: proporciones

• Condición de aplicación · n 5

(1 - ) · n 5• IP:

pz 2/

np

1

1

1

N

nN

np

Page 16: INFERENCIA estadística

Concepción San Luis

Ejemplo I. Probabilidad de proporciones

• La proporción de personas mayores de 65 años que padecen depresión en la población es de 0,15. ¿Entre que valores estará esta proporción en un centre geriátrico que té 40 residentes? (NC = 95%)

• Es un intervalo de probabilidad por qué tenemos la información de la población y queremos conocer la información para la muestra: = 0,15 ¿ p?

• C.A.: 40 · 0,15 = 6 i 40 · (1 - 0,15) = 34 Sí

• IP:%95261,0039,0

40

85,015,096,115,0

NC

Page 17: INFERENCIA estadística

Concepción San Luis

Intervalo de probabilidad: MEDIAS

Se asume normalidad de la variable en la població.

• IP:xz 2/

nx

1

N

nN

nx

Page 18: INFERENCIA estadística

Concepción San Luis

Ejemplo Intervalo de Probabilidad de MEDIAS

• ¿Entre qué valores se encontrará la media de edad de un grupo de 30 persones mayores de 65 anys que viven rn Madrid si en la població de origen de la muestra la media es de 72 años con una varianza de 5 años? (NC = 96%)

• De trata de un intervalo de probabilidad para la media de la muestra siendo en la población ( = 72)

• Se asume distribución normal e la edad en la población.

• IP: %9684,7216,71

30

50537,272 NC

Page 19: INFERENCIA estadística

Concepción San Luis

Intervalo de confianza: proporciones

• IC:

• Condición de aplicación

pzp 2/

n

ppp

1

1

1

N

nN

n

ppp

5ˆ15ˆ

5ˆ15ˆ

nn

nn

ss

ii

Page 20: INFERENCIA estadística

Concepción San Luis

CONTRASTE DE HIPÓTESIS

Page 21: INFERENCIA estadística

Concepción San Luis

1.- Se basa en las distribuciones muestrales.(modelos probabilísticos por tanto es un resultado probabilístico)

2.- Son un conjunto de técnicas que permiten comprobar la información que produce una muestra (observaciones) concuerda o no con una determinada distribución (modelo) de probabilidad conocido (distribución muestral). Lo que se prueba es los que denominamos H0.

Page 22: INFERENCIA estadística

Concepción San Luis

Como se decide. Criterio

Sea x = (x1,x2,x3…xn) las observaciones (datos obtenidos). Definimos un criterio (estadístico de contraste) que divide la distribución muestral del estadístico en dos partes:

• región Crítica (rechazo): Área de la distribución muestral que corresponde a los valores del estadístico de contraste tan alejados que es poco probable que ocurra (H0 se rechaza). Su probabilidad es α

• Región e Aceptación: Área de la distribución muestral que corresponde a los valores del estadístico de contraste no incluidos en la región crítica. Su probabiliad es 1-α (aceptar H0)

Page 23: INFERENCIA estadística

Concepción San Luis

CONSECUENCIAS

• El tamaño de las regiones de rechazo y aceptación quedan determinadas por α nivel de significación.

• Se interpreta como un nivel de error, por tanto su valor debe ser pequeño.

Page 24: INFERENCIA estadística

Concepción San Luis

Dado que hemos dividido la distribución en dos regiones dependiendo y que H0 y H1tienen que ser exhaustivas y excluyentes (se trata de tomar una decisión entre dos posibles), dependiendo de cómo formulemos H1 podemos hablar de contrastes bilaterales o unilaterales.

Page 25: INFERENCIA estadística

Concepción San Luis

Planteamiento de las hipótesis estadísticas

• Contraste bilateral:

H0: p = H0: =

H1: p H1: •Contraste Unilateral:

• Dcha:

H0: p H0:

H1: p > H1: > •Izda.:

H0: p H0:

H1: p < H1: <

xx

x

x

xx

Page 26: INFERENCIA estadística

Concepción San Luis

Procedimiento General para el contraste

1. Plantear la hipótesis nula H0.

2. Seleccionar una muestra (mediante una regla de muestreo).

3. Determinar la distribución muestral del estadístico de interés.

4. Seleccionar y calcular el estadístico de contraste (índice de discrepancia).

5.-Fijar el valor del riesgo .

6.- Comparar el estadístico el contraste con el valor de estadístico para α.

Page 27: INFERENCIA estadística

Concepción San Luis

¿Ha funcionado este procedimiento?

Aunque podríamos pensar que sí, todos lo hemos hecho de esta forma, hay varia críticas:Se han mezclado dos procedimientos encontrados: Se toma de Fisher la concepción y la sistemática del contrastar la H0.

Se introduce la H1 de Neyman Pearson y el proceso de toma de decisión entre DOS CONTRARIOS inaceptable en la filosofía de Fisher.CONSECUANCIA

Page 28: INFERENCIA estadística

Concepción San Luis

Que ha ocurrido

Se han mezclado dos procedimientos:Fisher: Contrastes de significación.Sólo una de las dos posibles soluciones

Rechazo H0 a un nivel α o decir que ni hay evidencia suficiente. No hay H1

Neyman Pearson: Plantean explícitamente la H1 (contrapuesta a H0) y se centran en un problema de toma de decisiones

Page 29: INFERENCIA estadística

Concepción San Luis

Errores asociados a la toma de decisión en la prueba de hipótesis

Carácter de la Hipótesis nula H0

verdadera falsa

No se ref uta la H0 Decisión correcta NC: 1 -

Error tipo I I

Decisión Es refuta la H0 Error tipo I

Decisión correcta

Potencia: 1 -

Page 30: INFERENCIA estadística

Concepción San Luis

Errores asociados a la toma de decisión en la prueba de hipótesis

Page 31: INFERENCIA estadística

Concepción San Luis

Reducción del error

Riesgo :

- Fijado por el investigador

Riesgo :

- Valor de

-Tamaño de la Muestra

- Tamaño del efecto

Page 32: INFERENCIA estadística

Concepción San Luis

Relación entre y

A medida que aumenta disminuye

Page 33: INFERENCIA estadística

Concepción San Luis

Relación entre y el tamaño de la muestra

A medida que aumenta el tamaño de la muestra disminuye el error estandar y por lo tanto el

riesgo de

n1 n2

n1 < n2

Page 34: INFERENCIA estadística

Concepción San Luis

Relación entre el riego y el valor verdadero de H1

Hay tantos valores de como H1 se hayan enunciado

Page 35: INFERENCIA estadística

Concepción San Luis

Todos los elementos contemplados en el cuadro de decisión ha sido sistemáticamente olvidados.

1995 La Taks Force propone como solución.

Añadir la potencia, el tamaño del efecto y los intervalos de confianza.

Page 36: INFERENCIA estadística

Concepción San Luis

Para que

Solventar los problemas de integración de resultados (El meta análisis).

Mejorar la comunicación

Facilitar los experimentos cruciales

Dar paso a un planteamiento más cercano a la modelización.

Page 37: INFERENCIA estadística

Concepción San Luis

A donde habíamos llegado

La concentración de esfuerzos en las pruebas de significación a llevado a que ne la enseñanza y en la investigación sólo nos preocupe buscar cual es la solución adecuada a nuestra situación de investigación concreta con el único interés en desechar la H0 sin preocuparnos de.

La implicación teórico practica y la búsqueda de explicaciones acumulativas que mejoren la comprensión de la realidad compleja.

Page 38: INFERENCIA estadística

Concepción San Luis

ASÍ TRABAJAMOS

Page 39: INFERENCIA estadística

Concepción San Luis

ÁRBOL DE DESISIÓN PARA LA ELECCIÓN DEL ESTADÍSTICO DE

CONTRASTE APROPIADO EN INVESTIGACIONES EN CIENCIAS

SOCIALES

¿En relación a cuántas muestras se pretende realizar la inferencia?

 

1 2 más de 2

Page 40: INFERENCIA estadística

Concepción San Luis

Contraste para la media

Contraste para la varianza

Contraste para la proporción

Contraste sobre promedios

SI

Bondad de ajuste

NO

TZ

SIGNOSWILCOXON

2

2

Z

Escala de intervalo y distribución

simétrica

SI

SI

SI

SISI

NO

NO

NO

NO

SI Varianza conocida

NO

Page 41: INFERENCIA estadística

Concepción San Luis

SI

SI

NO

NO

NO

NO

NO

NO

¿Muestras relacionadas?

¿Contraste paramétrico?

¿Contraste paramétrico?

T

Z

SI

Varianza conocida

Contraste de medias

SI

SI

Contraste varianzas

Contraste de proporciones

F

SI

SI

Z

Contraste promedios

SI

D NO

Homo-geneidad

SI

2

NO

Funcióndistribución

SI

W

NO

NO

T

Z

SI

Varianza conocida

Contraste medias SI

SI

Contraste varianzas

Contraste de proporciones

T

SI

SIZ

NO

B

NO

SI

Contraste promedios

Escala de intervalo y distribuc. simétrica

Contraste de proporciones

NO

WILCOXON

SI

SIGNOS

Page 42: INFERENCIA estadística

Concepción San Luis

NO

SI

2 ó más

NO

1 Nº de factores

¿ Efect. fijos?

¿Cont. paramétrico?

SI

NO

SI

SI

SI

SI

NO

NO

NO

NO

ANOVAunifact. SI

¿ Efect. fijos?

¿Interacción?

NO

¿Mues. depen.?

2 Fac.

SI

ANOVAmultiact.

Med. repe. en:

1 Fact.

K-W Jonckeere

¿ Orden predic.?

V. dicotómic.

Cocran

Friedman

SI

NO

¿Mues. depend.?

¿Muest. depen.?

ANOVA 1Fact.Med.Rep.

ANOVA1Fact. Mues.Ind.

Efect aleat

ANOVA1Fact. Mues.Ind.

Efect fijos ANOVA multifact. Muest ind.

Efect fijos Con interac. 

ANOVA multifact. Muest ind.Efect fijos Sin interac.

 

ANOVA multifact.Muest ind.

Efect aleat.

ANOVA multifact. Med. Rep.ANOVA

multifact. Med. Rep.en 1 Factor

Page 43: INFERENCIA estadística

Concepción San Luis

Un nuevo planteamiento

LA MODELIZACIÓN

Page 44: INFERENCIA estadística

Concepción San Luis