diseño de invstigacion
TRANSCRIPT
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
revisaremos dos ideas centrales:
qué es un diseño de investigación en epidemiología
y qué criterios se utilizan para clasificarlos.
HOLA!
Un diseño de investigación es un esquema de procedimientos, donde el investigador define las estrategias que aplicará para formular el problema de estudio y para resolverlo.
La epidemiología cuenta con un buen número de diseños de investigación, algunos más usados que otros.
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Para clasificar los diseños, la epidemiología utiliza cuatro criterios:
El alcance que persigue la investigación
La relación que el investigador establece con el fenómeno en estudio
La direccionalidad del análisis causal, y
La disponibilidad de los datos
Los dos primeros criterios diferencian los diseños básicos.
Los dos últimos permiten identificar variaciones al interior de cada diseño.
Veamos su s características uno a uno.
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Según la relación que el investigador establece con el fenómeno en estudio, las investigaciones epidemiológicas pueden ser de dos tipos
Cuando el investigador decide que va a observar el fenómeno en sus condiciones, habituales, procurando no modificarlo
OBSERVACIONALES
DE INTERVENCIÓN
Cuando el investigador decide observar la respuesta del fenómeno a ciertos cambios que él manipula voluntaria y cuidadosamente.
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Según su alcance, los estudios epidemiológicos pueden ser de dos tipos:
Cuando el interés principal del investigador es relatar los atributos o características principales del fenómeno. Dependiendo del fenómeno a estudiar, esta descripción podrá ser Cualitativa o Cuantitativa
DESCRIPTIVOS
ANALÍTICOS
Cuando el interés principal del investigador es explicar la relación que puede existir entre dos o más características del fenómeno
En todo estudio analìtico habrá, como mínimo, dos variables que el analista quiere relacionar: una “variable independiente” o posible causa y una “variable dependiente o” posible efecto
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
A su vez, los diseños analíticos pueden diferenciarse, según la direccionalidad del análisis, en tres categorías:
ANALISIS HACIA ADELANTE
ANÁLISIS HACIA ATRÁS
ANÁLISIS ADIRECCIONALES
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Cuando el investigador tiene información sobre una variable posiblemente explicativa y quiere relacionarla con un efecto en el mismo sujeto.
Decimos que hay un análisis “hacia delante”
El modelo utilizado para establecer la asociación, parte de la causa y va hacia el efecto
Una posible causa
Ej: el hecho de tener una
pareja fumadora
Un efecto Ej: el desarrollo de cáncer de
pulmón
¿ Se asocia con algo que ocurre
después?
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
El modelo diseñado para establecer la asociación, parte del efecto y va hacia la causa
Decimos que hay un análisis “hacia atrás”
Cuando el investigador tiene información sobre una variable que pudiera considerarse efecto, y quiere saber si está relacionada con un acontecimiento que ocurrió antes al mismo sujeto
Un efecto Ej: El diagnóstico de cáncer de
pulmón
Una posible causa
Ej: El antecedente de exposición a una pareja fumadora
¿ Se asocia con algo que ocurrió
antes?
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Un cuarto criterio para clasificar los diseños epidemiológicos se refiere a la disponibilidad del dato. Según este criterio los estudios pueden ser
Cuando el investigador se basa en datos que ya existen. En consecuencia el estudio tendrá que acomodarse al dato tal como fue registrado.
RETROSPECTIVOS
PROSPECTIVOS
Cuando el dato aún no existe o es deficiente, y el invetigador decide generarlo para el estudio. En este caso el investigador podrá obtener la información tal como él la necesita.
Combinan registros existentes y datos por obtener
AMBISPECTIVOS
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
RECAPITULANDO
En esta lección hemos revisado las variantes que pueden presentar los diseños epidemiológicos y cuya combinación permite clasificarlos.
Según acción del investigador
Observar el fenómeno
Intervenir el fenómeno
Según alcance del estudio
Describir el fenómeno
Analizar sus causas
Según tipode Análisis
Hacia el efecto
Hacia la causa
Según disponibilidad
del dato
Revisar el dato
Generar el dato
Sin dirección
Usar ambos
En las próximas lecciones, revisaremos cada uno de los diseños básicos utilizados en epidemiología
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Para avanzar en el tema te recomendamos revisar el siguiente material
Clasificación de los diseños de investigación en epidemiología
Luego de revisar los documentos anteriores , y una VEZ ESCRITA LA ,MONOGRAFÍA PLANTEA LA PREGUNTA E INICIA
DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA
Establecer relación entre variables antes no descritas
Caracterizar las variables
Dependiente Independiente Diseñar la hipótesis
Pruebas de HipótesisPruebas de HipótesisIntroducciónIntroducción
UMSNH - UMSNH - FIEFIE
La experiencia sobre el comportamiento de algún índice de La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar norma nos lleva a realizar proposiciones sobre el valor de proposiciones sobre el valor de algún parámetro estadísticoalgún parámetro estadístico. . Estas proposiciones se deben contrastar con la realidad Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposiciónentre aceptar o rechazar la proposición
Estas proposiciones se denominan Estas proposiciones se denominan HipótesisHipótesis y el y el procedimiento para decidir si se aceptan o se rechazan se procedimiento para decidir si se aceptan o se rechazan se denomina denomina Prueba de HipótesisPrueba de HipótesisUna prueba de hipótesis es una herramienta de análisis de Una prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un datos que puede en general formar parte de un experimento comparativoexperimento comparativo más completo más completo
Pruebas de HipótesisPruebas de Hipótesis
IntroducciónIntroducción
UMSNH - UMSNH - FIEFIE
Una Una hipótesis Estadísticahipótesis Estadística es un proposición sobre los es un proposición sobre los parámetros de una población o sobre la distribución de parámetros de una población o sobre la distribución de probabilidad de una variable aleatoriaprobabilidad de una variable aleatoria
EjemploEjemplo: Se tiene interés en la rapidez de combustión de un agente : Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribución de (esta rapidez es una variable aleatoria con alguna distribución de probabilidad). Especialmente interesa la rapidez de combustión probabilidad). Especialmente interesa la rapidez de combustión promedio (que es un parámetro (promedio (que es un parámetro (µµ) de dicha distribución). De manera ) de dicha distribución). De manera más específica, interesa decidir si esta rapidez promedio es o no 50 más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg.cm/seg.El planteamiento formal de la situación se realiza en términos de una El planteamiento formal de la situación se realiza en términos de una Hipótesis NulaHipótesis Nula (que es la proposición que se quiere poner a prueba) y (que es la proposición que se quiere poner a prueba) y una una Hipótesis AlternativaHipótesis Alternativa, la cual se aceptará si se rechaza la hipótesis , la cual se aceptará si se rechaza la hipótesis nula:nula:
Hipótesis Nula: Hipótesis Nula: HH00: : µµ = 50 cm/seg = 50 cm/seg
Hipótesis Alternativa:Hipótesis Alternativa: HH11: : µµ ≠≠ 50 cm/seg 50 cm/seg• En el ejemplo se tiene una En el ejemplo se tiene una Hipótesis Alternativa BilateralHipótesis Alternativa Bilateral, ya que se , ya que se verifica para valores de verifica para valores de µµ a ambos lados de 50 cm/seg. a ambos lados de 50 cm/seg.
Pruebas de HipótesisPruebas de Hipótesis
IntroducciónIntroducción
UMSNH - UMSNH - FIEFIE
En ocasiones interesa una En ocasiones interesa una Hipótesis Alternativa UnilateralHipótesis Alternativa Unilateral, , Por ejemplo:Por ejemplo:
HH00: : µµ = 50 cm/seg = 50 cm/seg HH00: : µµ = 50 cm/seg = 50 cm/seg
HH11: : µµ < 50 cm/seg < 50 cm/seg HH11: : µµ > 50 cm/seg > 50 cm/seg¿De donde puede surgir una Hipótesis Nula sobre un ¿De donde puede surgir una Hipótesis Nula sobre un
parámetro?parámetro?¿Cuál sería el interés dependiendo del origen de la ¿Cuál sería el interés dependiendo del origen de la
hipótesis?hipótesis?• OrigenOrigen: Experiencia, pruebas pasadas o conocimiento del proceso. : Experiencia, pruebas pasadas o conocimiento del proceso.
InterésInterés: averiguar si ha cambiado el parámetro: averiguar si ha cambiado el parámetro• OrigenOrigen: Alguna teoría o modelo sobre el funcionamiento del : Alguna teoría o modelo sobre el funcionamiento del
proceso. proceso. InterésInterés: Verificar la validés de dicha teoría: Verificar la validés de dicha teoría• Origen: Origen: Especificaciones de diseño, obligaciones contractuales, Especificaciones de diseño, obligaciones contractuales,
normas a cumplir o solicitudes del cliente.normas a cumplir o solicitudes del cliente. Interés: Interés: probar el probar el cumplimiento o incumplimiento de las especificaciones.cumplimiento o incumplimiento de las especificaciones.
La verdad o falsedad de la hipótesis NO puede La verdad o falsedad de la hipótesis NO puede conocerse con total seguridad a menos que pueda conocerse con total seguridad a menos que pueda examinarse toda la poblaciónexaminarse toda la población
óó
Pruebas de HipótesisPruebas de Hipótesis
IntroducciónIntroducción
UMSNH - UMSNH - FIEFIE
Procedimiento General para la prueba de una hipótesisProcedimiento General para la prueba de una hipótesis
Tomar un Tomar un muestramuestra aleatoriaaleatoria
Calcular un Calcular un estadísticoestadístico basado en la muestra basado en la muestra
Usar el estadístico y sus propiedades para tomar una Usar el estadístico y sus propiedades para tomar una decisióndecisión sobre la Hipótesis Nula sobre la Hipótesis Nula
Pruebas de HipótesisPruebas de HipótesisIntroducciónIntroducción
UMSNH - UMSNH - FIEFIE
EjemploEjemplo: Consideremos el ejemplo anterior de la rapidez de : Consideremos el ejemplo anterior de la rapidez de combustión. Aquí se tenía:combustión. Aquí se tenía: HH00: : µµ = 50 cm/seg = 50 cm/seg
HH11: : µµ ≠≠ 50 cm/seg 50 cm/seg
Aceptación de HAceptación de H00.- Un valor de la media muestral .- Un valor de la media muestral xx “muy “muy
cercano” a 50 cm/seg es una evidencia que apoya a la cercano” a 50 cm/seg es una evidencia que apoya a la hipótesis nula, sin embargo hipótesis nula, sin embargo es necesario introducir un es necesario introducir un criteriocriterio para decidir que tanto es muy cercano, para el para decidir que tanto es muy cercano, para el ejemplo este criterio pudiera ser: ejemplo este criterio pudiera ser: 48.5 48.5 ≤≤ x x ≤≤ 51.5, 51.5, si esto si esto ocurre se acepta Hocurre se acepta H00 De lo contrario, es decir, si De lo contrario, es decir, si x <x < 48.5 o x >51.5, 48.5 o x >51.5, se acepta se acepta
HH11
__
__
__ __
48.548.5 50 50 51.5 51.5
Región Crítica Región Crítica Región de aceptaciónRegión de aceptación Región Crítica Región CríticaSe acepta HSe acepta H11 Se acepta HSe acepta H00 Se acepta H Se acepta H11
µµ ≠≠ 50 50 µµ = 50 = 50 µµ ≠≠ 50 50
Valores CríticosValores Críticos
Pruebas de HipótesisPruebas de Hipótesis
Errores Tipo I y Tipo IIErrores Tipo I y Tipo II
UMSNH - UMSNH - FIEFIE
El procedimiento anterior puede llevarnos a una de dos El procedimiento anterior puede llevarnos a una de dos conclusiones erróneas:conclusiones erróneas:
Error Tipo IError Tipo I.- Se rechaza H.- Se rechaza H00 cuando ésta es verdadera cuando ésta es verdadera
En el ejemploEn el ejemplo se cometerá un error de tipo I cuando se cometerá un error de tipo I cuando µµ=50=50, , pero pero xx para la muestra considerada cae en la región crítica para la muestra considerada cae en la región críticaY se cometerá un error de tipo II cuando Y se cometerá un error de tipo II cuando µ ≠µ ≠ 50 50 pero pero xx para para la muestra considerada cae en la región de aceptación la muestra considerada cae en la región de aceptación
Error Tipo IIError Tipo II.- Se acepta H.- Se acepta H00 cuando ésta es falsa cuando ésta es falsa__
__
Condición realCondición real
DecisiónDecisiónHH00 verdadera verdadera HH00 falsa falsa
Rechazar HRechazar H00 Error Tipo IError Tipo I okok
Aceptar HAceptar H00 okok Error Tipo IIError Tipo II
Pruebas de HipótesisPruebas de Hipótesis
Error Tipo IError Tipo I
UMSNH - UMSNH - FIEFIE
A la probabilidad de cometer un error de Tipo I se denota A la probabilidad de cometer un error de Tipo I se denota por por αα, y se le llama el nivel o , y se le llama el nivel o tamaño de significanciatamaño de significancia de la de la prueba es decirprueba es decir
αα = P(error Tipo I)= P(rechazar H= P(error Tipo I)= P(rechazar H0 0 | H| H00 es verdadera) es verdadera)EjemploEjemplo: Calcular : Calcular αα para el ejemplo de la rapidez de combustión para para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es de la rapidez de combustión es σσ=2.5 cm/seg.=2.5 cm/seg.
__
αα = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))= normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79)) = 0.288+ 0.288 = = 0.288+ 0.288 = 0.05760.0576
Esto significa que el 5.76% de las muestras de tamaño 10 Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis Hconducirán al rechazo de la Hipótesis H00: : µµ=50 cm/seg, cuando ésta =50 cm/seg, cuando ésta
es verdaderaes verdadera..
SoluciónSolución: en este caso : en este caso αα = P( x caiga en la región crítica | = P( x caiga en la región crítica | µµ=50), es =50), es decir:decir:
αα = P( x < 48.5) + P( x > 51.5)= P( x < 48.5) + P( x > 51.5)RecordandoRecordando que La distribución de x es Normal con media que La distribución de x es Normal con media µ=50 µ=50 y y desviación estándar desviación estándar σσ//√√N =0.79, por lo tanto, usando Matlab: N =0.79, por lo tanto, usando Matlab:
__ ____
Pruebas de HipótesisPruebas de Hipótesis
Error Tipo IError Tipo I
UMSNH - UMSNH - FIEFIE
Es claro que Es claro que αα se puede reducir de dos maneras: se puede reducir de dos maneras:- Aumentando la región de aceptación- Aumentando la región de aceptación- Aumentando el tamaño de la muestra- Aumentando el tamaño de la muestra
EjemploEjemplo: recalcular : recalcular αα del ejemplo anterior para a) los nuevos límites de del ejemplo anterior para a) los nuevos límites de la región de aceptación 48 y 52. b) Para N=16 con los límites la región de aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas modificacionesoriginales c) con ambas modificaciones
SoluciónSolución::a) a) αα = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = =
0.01140.0114b) b) αα = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = =
0.01640.0164
c) c) αα = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = = 0.00140.0014
Pruebas de HipótesisPruebas de Hipótesis
Error tipo IIError tipo II
UMSNH - UMSNH - FIEFIE
Para evaluar un experimento de prueba de hipótesis Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de también se requiere calcular la probabilidad del error de Tipo II, denotada por Tipo II, denotada por ββ, es decir, es decir
ββ = P(error Tipo II) = P(aceptar H= P(error Tipo II) = P(aceptar H00 | H | H00 es falsa) es falsa)Sin embargo, no es posible calcular Sin embargo, no es posible calcular ββ si no se tiene una si no se tiene una hipótesis alternativa específica, es decir, un valor particular hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valoresdel parámetro bajo prueba en lugar de un rango de valores
Por ejemploPor ejemplo, supongamos que es importante rechazar H, supongamos que es importante rechazar H00 si si
la rapidez promedio de combustión la rapidez promedio de combustión µµ es mayor que 52 cm/ es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar Hrequiere evaluar la probabilidad de aceptar H00: : µµ=50 =50
cuando el valor verdadero es cuando el valor verdadero es µµ=52.=52.
Pruebas de HipótesisPruebas de Hipótesis
Error tipo IIError tipo II
UMSNH - UMSNH - FIEFIE
45 46 47 48 49 50 51 52 53 54 550
0.1
0.2
0.3
0.4
0.5
0.6
0.7
H0: H0: µµ=50=50
H1: H1: µµ=52=52
Usando Matlab:Usando Matlab: ββ = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.26430.2643
De acuerdo a la figura: De acuerdo a la figura: ββ = P(48.5 = P(48.5 ≤≤ x x ≤≤ 51.5 | 51.5 | µµ=52)=52)__
Pruebas de HipótesisPruebas de Hipótesis
Error tipo IIError tipo II
UMSNH - UMSNH - FIEFIE
Usando Matlab:Usando Matlab: ββ = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.89230.8923
La probabilidad de obtener un error de tipo II aumenta muy La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero rápido a medida que el valor verdadero µµ tiende al valor tiende al valor hipotético, por ejemplo, si suponemos que hipotético, por ejemplo, si suponemos que µµ=50.5, y =50.5, y recalculamos recalculamos ββ, obtenemos, obtenemos
ββ también depende del tamaño de la muestra, por ejemplo, también depende del tamaño de la muestra, por ejemplo, si N=16 obtenemos en el ejemplo cuando si N=16 obtenemos en el ejemplo cuando µµ=52: =52: σσ=0.625, =0.625, por lo tantopor lo tanto ββ = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.21190.2119
Es decir, Es decir, ββ disminuye cuando N aumenta, excepto si el disminuye cuando N aumenta, excepto si el valor real de valor real de µµ está muy cerca del hipotético está muy cerca del hipotético
Pruebas de HipótesisPruebas de Hipótesis
Conclusiones Fuerte y DébilConclusiones Fuerte y Débil
UMSNH - UMSNH - FIEFIE
Es por eso que Es por eso que el rechazo de Hel rechazo de H00 siempre se considera siempre se considera
como una como una Conclusión FuerteConclusión Fuerte. (los datos aportan fuerte . (los datos aportan fuerte evidencia de que Hevidencia de que H00 es falsa) es falsa)
Como uno puede elegir los valores críticos del intervalo de Como uno puede elegir los valores críticos del intervalo de aceptación aceptación uno controla el valor de uno controla el valor de αα. Uno puede entonces . Uno puede entonces controlar la probabilidad de rechazar de manera errónea controlar la probabilidad de rechazar de manera errónea HH00..
La decisión de La decisión de aceptar Haceptar H00 se considera una se considera una Conclusión Conclusión
DébilDébil, a menos que se sepa que , a menos que se sepa que ββ es considerablemente es considerablemente pequeño.pequeño.
Por esto en lugar de decir “Por esto en lugar de decir “se acepta Hse acepta H00” se prefiere decir ” se prefiere decir
““incapaz de rechazar Hincapaz de rechazar H00”, es decir, no se ha encontrado ”, es decir, no se ha encontrado
evidencia suficiente para rechazar Hevidencia suficiente para rechazar H00. O sea, . O sea, no quiere no quiere
decir que exista gran evidencia de que Hdecir que exista gran evidencia de que H 00 sea cierta sino sea cierta sino
que no hay gran evidencia de que sea falsaque no hay gran evidencia de que sea falsa..
Pruebas de HipótesisPruebas de Hipótesis
Hipótesis UnilateralesHipótesis Unilaterales
UMSNH - UMSNH - FIEFIE
HH00: : µµ=50 cm/seg=50 cm/seg
HH11: : µµ<50 cm/seg<50 cm/seg
En el ejemplo supongamos que si la rapidez media de En el ejemplo supongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿cómo deben plantearse esto con una conslusión fuerte. ¿cómo deben plantearse las hipótesis?las hipótesis?
Nótese que aunque HNótese que aunque H00 está planteada como una igualdad, está planteada como una igualdad,
se sobre-entiende que incluye cualquier valor de se sobre-entiende que incluye cualquier valor de µµ no no especificado por Hespecificado por H11, es decir, , es decir, la incapacidad de rechazar la incapacidad de rechazar
HH00 no significa que no significa que µµ=50, sino que no se tiene evidencia =50, sino que no se tiene evidencia
fuerte que apoye a Hfuerte que apoye a H11, , es decires decir, pudiera ser que , pudiera ser que µµ=50=50 o o
que que µµ>50>50
Pruebas de HipótesisPruebas de Hipótesis
Hipótesis UnilateralesHipótesis Unilaterales
UMSNH - UMSNH - FIEFIE
EjemploEjemplo: Un embotellador de refresco desea estar seguro : Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor de que las botellas que usa tienen en promedio un valor que supera el mínimo de présión de estallamiento de 200 que supera el mínimo de présión de estallamiento de 200 psi. El embotellador puede formular una prueba de psi. El embotellador puede formular una prueba de hipótesis de dos maneras:hipótesis de dos maneras:
Con el planteamiento (1) Como el rechazo de HCon el planteamiento (1) Como el rechazo de H00 es una es una
conclusión fuerte, esto obliga al fabricante a demostrar conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor (aportar evidencia) de que las botellas soportan mayor presión que 200 psipresión que 200 psi
HH00: : µµ=200 psi=200 psi HH00: : µµ=200 psi=200 psi
HH11: : µµ>200 psi>200 psi HH11: : µµ<200 psi<200 psi(1)(1)(2)(2)
Con el planteamiento (2) si se rechaza HCon el planteamiento (2) si se rechaza H00 se concluye que se concluye que
las botellas no soportan los 200 psi, es decir, se concluye las botellas no soportan los 200 psi, es decir, se concluye que las botellas son satisfactorias a menos que halla que las botellas son satisfactorias a menos que halla evidencia fuerte en sentido contrarioevidencia fuerte en sentido contrario
¿cuál planteamiento es el correcto?¿cuál planteamiento es el correcto?
Pruebas de HipótesisPruebas de Hipótesis
Hipótesis UnilateralesHipótesis Unilaterales
UMSNH - UMSNH - FIEFIE
Es decir, en la Hipótesis alternativa se debe poner Es decir, en la Hipótesis alternativa se debe poner la proposición sobre la cual es importante llegar a la proposición sobre la cual es importante llegar a una conclusión fuerte:una conclusión fuerte:
HH00: : µµ=200 psi=200 psi HH00: : µµ=200 psi=200 psi
HH11: : µµ>200 psi>200 psi HH11: : µµ<200 psi<200 psi(1)(1)(2)(2)
Pruebas de HipótesisPruebas de Hipótesis
Procedimiento general para la prueba de Procedimiento general para la prueba de HipótesisHipótesis
UMSNH - UMSNH - FIEFIE
Antes de Examinar los datos muestrales:Antes de Examinar los datos muestrales:1.1. Identificar el parámetro de interésIdentificar el parámetro de interés2.2. Establecer la Hipótesis Nula HEstablecer la Hipótesis Nula H00
3.3. Especificar una Hipótesis alternativa adecuada HEspecificar una Hipótesis alternativa adecuada H11
4.4. Seleccionar un nivel de significancia Seleccionar un nivel de significancia ααUsando los datos muestrales:Usando los datos muestrales:
5. 5. Establecer un estadístico de prueba adecuadoEstablecer un estadístico de prueba adecuado6. 6. Establecer una región de rechazoEstablecer una región de rechazo7. 7. Calcular todas las cantidades muestrales Calcular todas las cantidades muestrales
necesarias para el estadísticonecesarias para el estadístico8. 8. Decidir si debe o no rechazarse HDecidir si debe o no rechazarse H00
Pruebas de HipótesisPruebas de Hipótesis
Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida
UMSNH - UMSNH - FIEFIE
Si se desea probar la Hipótesis:Si se desea probar la Hipótesis:HH00: : µ µ = = µµ00
HH11: : µ ≤µ ≤ µµ00
Se puede usar el estadístico de prueba Z siguienteSe puede usar el estadístico de prueba Z siguiente
El cual tiene una distribución Normal con media cero y El cual tiene una distribución Normal con media cero y varianza 1 (si se cumplen las suposiciones del teorema del varianza 1 (si se cumplen las suposiciones del teorema del límite central)límite central)
Nσ/
μXZ 0
__
−=
Pruebas de HipótesisPruebas de Hipótesis
Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida
UMSNH - UMSNH - FIEFIE
Entonces, para una Entonces, para una αα dada podemos establecer las dada podemos establecer las siguientes regiones de aceptación y crítica:siguientes regiones de aceptación y crítica:
-z-zαα/2 /2 zzαα/2/2 Z Z
αα/2 /2 αα/2/2
Región de aceptaciónRegión de aceptaciónregión crítica región críticaregión crítica región crítica
ConclusionesConclusiones::
Rechazar HRechazar H00 si: si: z < -zz < -zαα/2/2 o z > z o z > zαα/2/2
No rechazar HNo rechazar H00 si: si: - z- zαα/2/2 ≤≤ z z ≤≤ z zαα/2/2
Pruebas de HipótesisPruebas de Hipótesis
Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida
UMSNH - UMSNH - FIEFIE
EjemploEjemplo: Se ilustrarán los 8 pasos del procedimiento : Se ilustrarán los 8 pasos del procedimiento general para el ejemplo del combustible sólido para general para el ejemplo del combustible sólido para sistemas de escape de aeronaves. En este caso se conoce sistemas de escape de aeronaves. En este caso se conoce σσ=2 cm/seg, se desea probar si la media =2 cm/seg, se desea probar si la media µµ es de 50 es de 50 cm/seg. Se selecciona una muestra aleatoria de tamaño cm/seg. Se selecciona una muestra aleatoria de tamaño N=25, obteniendo x=51.3 cm/seg. N=25, obteniendo x=51.3 cm/seg. Se especifica un nivel de Se especifica un nivel de sginificancia sginificancia αα=0.05=0.05 ¿A qué conclusiones se debe llegar? ¿A qué conclusiones se debe llegar?
• El parámetro de interés es El parámetro de interés es µµ (rapidez promedio de (rapidez promedio de combustión)combustión)
• HH00: : µµ = 50 cm/seg = 50 cm/seg• HH11: : µµ ≠≠ 50 cm/seg 50 cm/seg∀ αα = 0.05= 0.05
__
Pruebas de HipótesisPruebas de Hipótesis
Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida
UMSNH - UMSNH - FIEFIE
5) La estadística de prueba es 5) La estadística de prueba es
6) Rechazar H6) Rechazar H00 si z>1.96 o si z<-1.96 si z>1.96 o si z<-1.96 (consecuencia del (consecuencia del
paso 4)paso 4)7) cálculos7) cálculos
8) Conclusión como z = 3.25 > 1.96, 8) Conclusión como z = 3.25 > 1.96, se rechaza Hse rechaza H00: : µµ = 50 = 50
cm/seg con un nivel de significancia cm/seg con un nivel de significancia αα = 0.05 = 0.05
8) Es decir, 8) Es decir, Se concluye que en base a una muestra de 25 Se concluye que en base a una muestra de 25 mediciones la rapidez promedio de combustión es mediciones la rapidez promedio de combustión es diferente de 50 cm/segdiferente de 50 cm/seg, de hecho, existe evidencia , de hecho, existe evidencia fuerte de que ésta es mayor.fuerte de que ésta es mayor.
Nσ/
μXZ 0
__
−=
25.3252/
503.51Z =−=
Pruebas de HipótesisPruebas de Hipótesis
Valores PValores P
UMSNH - UMSNH - FIEFIE
Una manera de notificar los resultados de una prueba de Una manera de notificar los resultados de una prueba de hipótesis es establecer si la hipótesis nula fue o no hipótesis es establecer si la hipótesis nula fue o no rechazada con un rechazada con un nivel especificado nivel especificado αα de significancia de significancia
Una alternativa es especificar Una alternativa es especificar el nivel de significancia el nivel de significancia αα más pequeño que conduce al rechazo de la hipótesis nulamás pequeño que conduce al rechazo de la hipótesis nula. . A este se le llama el A este se le llama el Valor PValor P
Este valor P sólo depende de la muestra tomada, es decir, Este valor P sólo depende de la muestra tomada, es decir, para una muestra y un estadístico calculado se puede para una muestra y un estadístico calculado se puede obtener su valor P y comparar con un obtener su valor P y comparar con un αα especificado. especificado. Entonces, Entonces, si P<si P<αα, H, H00 se rechaza se rechaza..
Pruebas de HipótesisPruebas de Hipótesis
Valores PValores P
UMSNH - UMSNH - FIEFIE
En el caso de la distribución normal para la pureba sobre la En el caso de la distribución normal para la pureba sobre la media es fácil calcular el valor P. Si zmedia es fácil calcular el valor P. Si z00 fue el valor calculado fue el valor calculado
del estadístico de prueba, entonces:del estadístico de prueba, entonces:
Donde Donde ΦΦ(z) = P(Z(z) = P(Z≤≤z) (Función de distribución normal z) (Función de distribución normal N(0,1))N(0,1))Para el ejemplo zPara el ejemplo z00= 3.25, entonces P=2(1-= 3.25, entonces P=2(1-ΦΦ(3.25))=0.0012. (3.25))=0.0012.
Es decir, HEs decir, H00 será rechazada con cualquier nivel de será rechazada con cualquier nivel de
significancia significancia αα ≥≥ 0.0012 0.0012
P = P =
2 [ 1- 2 [ 1- ΦΦ(|z(|z00|) ]|) ] Prueba de dos colas: HPrueba de dos colas: H00::µµ==µµ00, H, H11::µµ ≠≠ µµ00
1- 1- ΦΦ(z(z00)) Prueba de cola superior: HPrueba de cola superior: H00::µµ==µµ00, H, H11::µµ > > µµ00
ΦΦ(z(z00)) Prueba de cola inferior: HPrueba de cola inferior: H00::µµ==µµ00, H, H11::µµ < < µµ00
Si se usa el enfoque del valor P el paso 6 del procedimiento Si se usa el enfoque del valor P el paso 6 del procedimiento general de prueba de hipótesis ya no es necesario.general de prueba de hipótesis ya no es necesario.
Pruebas de HipótesisPruebas de Hipótesis
Error Tipo II y tamaño de la muestraError Tipo II y tamaño de la muestra
UMSNH - UMSNH - FIEFIE
Consideremos la hipótesis bilateral Consideremos la hipótesis bilateral HH00::µµ==µµ00, H, H11::µµ ≠≠ µµ0.0.
Si HSi H00 es falsa y la media verdadera es es falsa y la media verdadera es µ µ = = µµ00 + + δ δ (con(con δδ>0>0)). .
El estadístico de pruebaEl estadístico de prueba
se puede escribir como se puede escribir como
Es decir, Si HEs decir, Si H11 es verdadera Z tiene distribución Normal con es verdadera Z tiene distribución Normal con
media media y varianza 1. y varianza 1. Por lo tanto, el error Tipo 1 (Por lo tanto, el error Tipo 1 (ββ) se puede calcular como) se puede calcular como
Nσ/
μXZ 0
__
−=
σNδ
Nσ/
δ)(μXZ 0
__
++−=
σNδ
+≈σNδ
zβ α/2Φ
Y si definimos Y si definimos ββ = = ΦΦ(-z(-zββ), obtenemos), obtenemosδ
)σz(zN βα/2 +
≈
Pruebas de HipótesisPruebas de Hipótesis
Error Tipo II y tamaño de la muestraError Tipo II y tamaño de la muestra
UMSNH - UMSNH - FIEFIE
Para el ejemplo del combustible sólido. Si al analista le Para el ejemplo del combustible sólido. Si al analista le interesa diseñar la prueba de hipótesis de manera que si el interesa diseñar la prueba de hipótesis de manera que si el valor verdadero de valor verdadero de µµ es 51 cm/seg se rechace H es 51 cm/seg se rechace H00 con una con una
probabilidad alta (por ejemplo 90%) y con el mismo valor probabilidad alta (por ejemplo 90%) y con el mismo valor anterior de anterior de αα=0.05=0.05En este caso En este caso δδ=1, =1, σσ=2, =2, αα=0.05 por lo tanto, mediante =0.05 por lo tanto, mediante Matlab:Matlab:
N= 4*(norminv(0.025) + norminv(0.1))^2 N= 4*(norminv(0.025) + norminv(0.1))^2 ≈≈ 4242
ObservaciónObservación: Debe tenerse cuidado cuando se interpretan : Debe tenerse cuidado cuando se interpretan los resultados basados en una los resultados basados en una muestra muy grandemuestra muy grande, ya que , ya que es muy probable que se detecte cualquier alejamiento es muy probable que se detecte cualquier alejamiento (muy pequeño) respecto al valor hipotético (muy pequeño) respecto al valor hipotético µµoo . . Esta Esta
diferencia podría no tener ninguna importancia práctica diferencia podría no tener ninguna importancia práctica pero conducir al rechazo de Hpero conducir al rechazo de H00
Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos
medias (varianzas conocidas)medias (varianzas conocidas)
UMSNH - UMSNH - FIEFIE
Se tienen Se tienen dos poblacionesdos poblaciones de interés. La primera con media de interés. La primera con media µµ11 y varianza y varianza σσ11
22 conocidas y la segunda con media conocidas y la segunda con media µµ22 y y
varianza varianza σσ2222 conocidas. Interesa saber si las dos medias conocidas. Interesa saber si las dos medias
son iguales. Se plantean las hipótesisson iguales. Se plantean las hipótesis HH00: : µµ11 = = µµ22
HH11: : µµ11 ≠≠ µµ22
Por lo tanto el siguiente estadístico de pruebaPor lo tanto el siguiente estadístico de prueba
Es N(0,1) si HEs N(0,1) si H00 es verdadera. es verdadera.
Por lo tanto Por lo tanto se rechazará Hse rechazará H00 si z si z00>z>zαα/2/2 o z<z o z<z--αα/2/2
SuposicionesSuposiciones: Las dos poblaciones son normales o se : Las dos poblaciones son normales o se cumplen las condiciones del teorema del límite central. cumplen las condiciones del teorema del límite central. EntoncesEntonces el estadístico X el estadístico X11-X-X22 es una variable Normal con es una variable Normal con
media media µµ1 1 - - µµ2 2 y varianza y varianza σσ1122 /N /N11+ + σσ22
2/2//N/N22
__ __
2
22
1
21
2
___
1
___
Nσ
Nσ
XXZ
+
−=
Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos
medias (varianzas conocidas)medias (varianzas conocidas)
UMSNH - UMSNH - FIEFIE
EjemploEjemplo: Un diseñador quiere reducir el tiempo de secado : Un diseñador quiere reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura. La de una pintura. Se prueban dos fórmulas de pintura. La fórmula 1 es la normal y la fórmula 2 posee un ingrediente fórmula 1 es la normal y la fórmula 2 posee un ingrediente secante que se espera reduzca el tiempo de secado. Se secante que se espera reduzca el tiempo de secado. Se sabe que el tiempo de secado tiene una desviación sabe que el tiempo de secado tiene una desviación estándar de 8 min y que ésta no se afecta con la adición del estándar de 8 min y que ésta no se afecta con la adición del nuevo ingrediente. Se pintan 10 especímenes con la nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos promedio de secado de xpromedio de secado de x11=121 min, y x=121 min, y x22=112 min. =112 min.
respectivamente. ¿A qué conclusión se llega sobre la respectivamente. ¿A qué conclusión se llega sobre la eficacia del nuevo ingrediente utilizando eficacia del nuevo ingrediente utilizando αα=0.05.?=0.05.?• Cantidad de interés: Cantidad de interés: µµ1 1 - - µµ22
• HH00: : µµ11 = = µµ22 • HH11: : µµ11 > > µµ22 (se busca evidencia fuerte que indique que el (se busca evidencia fuerte que indique que el
tiempo de secado promedio de la muestra 2 es menor)tiempo de secado promedio de la muestra 2 es menor)
_ _ __
Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos
medias (varianzas conocidas)medias (varianzas conocidas)
UMSNH - UMSNH - FIEFIE
∀ αα=0.05=0.05• El estadístico de prueba es El estadístico de prueba es
• HH00 se rechazará si z>z se rechazará si z>z0.050.05 = 1.645 = 1.645• Sustituyendo los datos, obtenemos z=(121-112)/Sustituyendo los datos, obtenemos z=(121-112)/
(12.8)(12.8)1/21/2=2.52=2.52• Conclusión: Puesto que z = 2.52 > 1.645 se rechaza HConclusión: Puesto que z = 2.52 > 1.645 se rechaza H00
con un nivel de significancia con un nivel de significancia αα=0.05 concluyéndose el =0.05 concluyéndose el nuevo ingrediente sí disminuye el tiempo de secado.nuevo ingrediente sí disminuye el tiempo de secado.
Alternativamente puede calcularse un valor P =1-Alternativamente puede calcularse un valor P =1-ΦΦ(2.52) = 0.0059, es decir, se rechazará H(2.52) = 0.0059, es decir, se rechazará H00 para para
cualquier nivel de significancia cualquier nivel de significancia α≥α≥0.00590.0059
2
22
1
21
2
___
1
___
Nσ
Nσ
/)XX(Z +−=
Pruebas de HipótesisPruebas de HipótesisIdentificación Causa - EfectoIdentificación Causa - Efecto
UMSNH - UMSNH - FIEFIE
En el ejemplo anterior se supone que fueron asignados En el ejemplo anterior se supone que fueron asignados de de manera aleatoriamanera aleatoria 10 especímenes a una fórmula 10 especímenes a una fórmula ((tratamientotratamiento) y 10 especímenes a la otra luego se aplicó la ) y 10 especímenes a la otra luego se aplicó la pintura en un pintura en un orden aleatorioorden aleatorio a cada especímen hasta a cada especímen hasta pintar los 20. Este es un pintar los 20. Este es un Experimento Completamente Experimento Completamente AleatorizadoAleatorizado..
En un estudio estadístico sobre la incidencia del cáncer En un estudio estadístico sobre la incidencia del cáncer pulmonar entre personas que fuman normalmente se hace pulmonar entre personas que fuman normalmente se hace un seguimiento en el tiempo de los individuos a prueba. un seguimiento en el tiempo de los individuos a prueba. Este es un Este es un Experimento ObservacionalExperimento Observacional
En este caso no se puede asignar de manera aleatoria un En este caso no se puede asignar de manera aleatoria un tratamiento u otro (fumar o no fumar) a una porción de los tratamiento u otro (fumar o no fumar) a una porción de los individuos. Por otro lado, el hábito de fumar no es el único individuos. Por otro lado, el hábito de fumar no es el único factor que influye en el desarrollo de cáncer pulmonar.factor que influye en el desarrollo de cáncer pulmonar.
Pruebas de HipótesisPruebas de HipótesisPrueba de Hipótesis sobre la media, Prueba de Hipótesis sobre la media, varianza varianza
desconocidadesconocida
UMSNH - UMSNH - FIEFIE
Si la población tiene una distribución Normal con media Si la población tiene una distribución Normal con media µµ y y varianza varianza σσ22 desconocidas pudiera utilizarse el estadístico S desconocidas pudiera utilizarse el estadístico S22 y el procedimiento descrito anteriormente para varianza y el procedimiento descrito anteriormente para varianza conocida (esto es válido para N grande), pero si la muestra conocida (esto es válido para N grande), pero si la muestra es pequeña, tendremos que usar el estadístico siguiente,es pequeña, tendremos que usar el estadístico siguiente,
el cual tiene una distribución t con N-1 grados de libertad,el cual tiene una distribución t con N-1 grados de libertad,
Así, para la prueba de Hipótesis bilateral Así, para la prueba de Hipótesis bilateral HH00: : µ µ = = µµ00
HH11: : µµ ≠≠ µµ00
Se rechazará HSe rechazará H00 si t>t si t>tαα/2,N-1/2,N-1 o si t<t o si t<t--αα/2,N-1/2,N-1
NS/
μXT 0
__
−=
Pruebas de HipótesisPruebas de HipótesisPrueba de Hipótesis sobre la media, Prueba de Hipótesis sobre la media, varianza varianza
desconocidadesconocida
UMSNH - UMSNH - FIEFIE
EjercicioEjercicio: Los siguientes son datos de pruebas de : Los siguientes son datos de pruebas de resistencia a la adhesión, los siguientes datos presentan la resistencia a la adhesión, los siguientes datos presentan la carga (en Mpa) a la cual 22 especímenes fallaron carga (en Mpa) a la cual 22 especímenes fallaron
¿Sugieren los datos que la carga promedio de falla es ¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga de falla tiene mayor que 10Mpa? Supóngase que la carga de falla tiene una distribución Normal y utilice una distribución Normal y utilice αα=0.05. Desarrolle los 8 =0.05. Desarrolle los 8 pasos del procedimiento general y encuentre un valor P pasos del procedimiento general y encuentre un valor P para la prueba.para la prueba.
19.8 18.5 17.6 16.7 15.8 15.4
14.1 13.6 11.9 11.4 11.4 8.8
7.5 15.4 15.4 19.5 14.9 12.7
11.9 11.4 10.1 7.9
Pruebas de HipótesisPruebas de Hipótesis
Valor P de una prueba tValor P de una prueba t
UMSNH - UMSNH - FIEFIE
El valor P es el más pequeño nivel de significancia para el El valor P es el más pequeño nivel de significancia para el que Hque H00 debe rechazarse, esto es debe rechazarse, esto es el área de la colael área de la cola (de la (de la
curva de densidad de probabilidad) que está más allá del curva de densidad de probabilidad) que está más allá del valor del estadístico (en este caso t). o el doble de esta valor del estadístico (en este caso t). o el doble de esta área en pruebas bilaterales.área en pruebas bilaterales.
Selección del Tamaño de la MuestraSelección del Tamaño de la Muestra
En todas las pruebas de hipótesis estadísticas se puede En todas las pruebas de hipótesis estadísticas se puede calcular el tamaño de la muestra (N) adecuada en función calcular el tamaño de la muestra (N) adecuada en función de la magnitud del error de tipo I que se permite. En cada de la magnitud del error de tipo I que se permite. En cada tipo de prueba se encuentran fórmulas diferentes para N.tipo de prueba se encuentran fórmulas diferentes para N.
Pruebas de HipótesisPruebas de Hipótesis
Otras pruebas de HipótesisOtras pruebas de Hipótesis
UMSNH - UMSNH - FIEFIE
En forma similar a como se describió el caso de la media y En forma similar a como se describió el caso de la media y la diferencia de medias, se pueden realizar diferentes la diferencia de medias, se pueden realizar diferentes pruebas de hipótesis para estos mismos u otros pruebas de hipótesis para estos mismos u otros parámetros, lo único que cambia en cada caso es:parámetros, lo único que cambia en cada caso es:
- Las suposiciones sobre la distribución de la - Las suposiciones sobre la distribución de la poblaciónpoblación
- El estadístico elegido y por consiguiente- El estadístico elegido y por consiguiente- La distribución del estadístico.- La distribución del estadístico.
En la siguiente tabla se resumen algunas de las pruebas de En la siguiente tabla se resumen algunas de las pruebas de hipótesis más utilizadashipótesis más utilizadas
Pruebas de HipótesisPruebas de HipótesisOtras pruebas paramétricas de HipótesisOtras pruebas paramétricas de Hipótesis
UMSNH - UMSNH - FIEFIE
Prueba sobrePrueba sobre Hipótesis NulaHipótesis Nula SuposicionesSuposiciones Estadístico Estadístico de Pruebade Prueba
La mediaLa mediaµ µ = = µµ00 σσ22 conocida conocida NormalNormal
µ µ = = µµ00 σσ22 desconocida desconocida TT
Igualdad de Igualdad de mediasmedias
µµ11 = = µµ22 σσ1122 = = σσ22
22 conocidas conocidas NormalNormal
µµ11 = = µµ22 σσ1122 = = σσ22
22 desconocidas desconocidas TT
µµ11 = = µµ22 σσ1122 ≠≠ σσ22
22 conocidas conocidas TT
La varianzaLa varianzaσσ22 = = σσ00
22 dist. Normal, N pequeñadist. Normal, N pequeña JiJi22
σσ22 = = σσ0022 N grandeN grande NormalNormal
Igualdad de dos Igualdad de dos varianzasvarianzas
σσ1122 = = σσ22
22 FF
Una proporciónUna proporción p = pp = p00 NormalNormal
Igualdad de dos Igualdad de dos proporcionesproporciones
pp11 = p = p22 NormalNormal
Pruebas de HipótesisPruebas de Hipótesis
Pruebas de Hipótesis No ParamétricasPruebas de Hipótesis No Paramétricas
UMSNH - UMSNH - FIEFIE
Las pruebas de hipótesis anteriores se llaman Las pruebas de hipótesis anteriores se llaman paramétricasparamétricas porque suponen conocida la distribución de la población y porque suponen conocida la distribución de la población y la hipótesis es acerca de los parámetros de dicha la hipótesis es acerca de los parámetros de dicha distribución. distribución.
Otra clase de hipótesis es: No se sabe cual es la Otra clase de hipótesis es: No se sabe cual es la distribución de la población y distribución de la población y se desea probar la hipótesis se desea probar la hipótesis de que cierta distribución en particular será un modelo de que cierta distribución en particular será un modelo satisfactoriosatisfactorio. Por ejemplo, tal vez se requiera probar si la . Por ejemplo, tal vez se requiera probar si la distribución es Normaldistribución es Normal
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Se parte de una Se parte de una muestra aleatoriamuestra aleatoria de tamaño N, de tamaño N, proveniente de una población cuya distribución de proveniente de una población cuya distribución de probabilidad es desconocida.probabilidad es desconocida. Las N observaciones se acomodan en un Las N observaciones se acomodan en un HistogramaHistograma de de frecuencia con k intervalos de clase. Sea frecuencia con k intervalos de clase. Sea OOii la i-ésima la i-ésima
frecuencia de clasefrecuencia de clase De la distribución de probabilidad propuesta se calcula la De la distribución de probabilidad propuesta se calcula la frecuencia esperada Efrecuencia esperada Eii en el i-ésimo intervalo de clase en el i-ésimo intervalo de clase
El El estadístico de prueba estadístico de prueba eses
El cual tiene una El cual tiene una distribución Jidistribución Ji22 con k-p-1 grados de con k-p-1 grados de libertad libertad si la población sigue la distribución propuesta. si la población sigue la distribución propuesta. (donde p es el número de parámetros de la población)(donde p es el número de parámetros de la población)
∑=
−=k
1i i
2ii2
E)E(O
χ
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
La aproximación mejora a medida que N es más grandeLa aproximación mejora a medida que N es más grande
La hipótesis debe rechazarse si el valor del estadístico de La hipótesis debe rechazarse si el valor del estadístico de prueba esprueba es
χχ2 2 > > χχ221-1-αα,k-p-1,k-p-1
PrecauciónPrecaución: Si las frecuencias esperadas son muy : Si las frecuencias esperadas son muy pequeñas el estadístico pequeñas el estadístico χχ22 no reflejará el alejamiento entre no reflejará el alejamiento entre lo observado y lo esperado. (Se considera que valores lo observado y lo esperado. (Se considera que valores menores de 5 son pequeños)menores de 5 son pequeños) Si en una prueba resultan frecuencias esperadas Si en una prueba resultan frecuencias esperadas pequeñas, se pueden pequeñas, se pueden combinar intervalos de clase combinar intervalos de clase adyascentesadyascentes para aumentar estos valores, ya que no es para aumentar estos valores, ya que no es necesario que los anchos de clase sean del mismo tamañonecesario que los anchos de clase sean del mismo tamaño
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Ejemplo 1Ejemplo 1.- Un algoritmo para generar enteros .- Un algoritmo para generar enteros pseudoealeatorios de 0 a 9 ´se prueba para determinar si pseudoealeatorios de 0 a 9 ´se prueba para determinar si tiene una distribución uniforme, para ello se generan 1000 tiene una distribución uniforme, para ello se generan 1000 números, obteniendo la siguiente tabla de frecuencia. números, obteniendo la siguiente tabla de frecuencia. ¿Existe evidencia de que el generador funciona de manera ¿Existe evidencia de que el generador funciona de manera correcta?. Utilice correcta?. Utilice αα=0.05=0.05
Como EComo Eii se puede calcular sin estimar ningún parámetro a se puede calcular sin estimar ningún parámetro a
partir de la muestra, entonces p=0 y el estadístico será jipartir de la muestra, entonces p=0 y el estadístico será ji22 con k-p-1=10-0-1=9 grados de libertad.con k-p-1=10-0-1=9 grados de libertad.
0 1 2 3 4 5 6 7 8 9
Oi 94 93 112 101 104 95 100 99 108 94
Ei 100 100 100 100 100 100 100 100 100 100
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Variable de interés: distribución de los números Variable de interés: distribución de los números pseudoaleatoriospseudoaleatorios
HH00: La distribución es uniforme en el intervalo de 0 a 9: La distribución es uniforme en el intervalo de 0 a 9 H1: La distribución No es uniforme en ese intervaloH1: La distribución No es uniforme en ese intervalo αα = 0.05= 0.05 El estadístico de prueba es El estadístico de prueba es Se rechazará HSe rechazará H00 si si χχ22> > χχ22 0.05,90.05,9=16.92=16.92 CálculosCálculos
χχ22= 0.01*( (94-100)= 0.01*( (94-100)22+(93-100)+(93-100)22+...+(94-100)+...+(94-100)22 )=3.72 )=3.729)9) Conclusiones: como 3.72 < 16.92 No es posible Conclusiones: como 3.72 < 16.92 No es posible
rechazar la hipótesis. Por lo tanto parece ser que el rechazar la hipótesis. Por lo tanto parece ser que el generador de números aleatorios trabaja bien. generador de números aleatorios trabaja bien.
¿Cual es el valor P de la prueba ?¿Cual es el valor P de la prueba ?
∑=
−=k
1i i
2ii2
E
)E(Oχ
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Ejemplo 2Ejemplo 2.- Se propone que el número de defectos en .- Se propone que el número de defectos en tarjetas de circuito impreso sigue una tarjetas de circuito impreso sigue una distribución de distribución de PoissonPoisson. Se obtiene una muestra de 60 tarjetas y se . Se obtiene una muestra de 60 tarjetas y se observa el número de defectos, con los siguientes observa el número de defectos, con los siguientes resultados:resultados:
defectosdefectos 00 11 22 33 4 o más4 o más
OOii 3232 1515 99 44 00
Distribución de PoissonDistribución de Poisson. Es una distribución discreta cuya . Es una distribución discreta cuya función de probabilidad es función de probabilidad es
Definida para x=0,1,2,3,...Definida para x=0,1,2,3,...∞∞. Donde . Donde µµ es la media de X es la media de X
x!μe
f(x)x-μ
=
Pruebas de HipótesisPruebas de HipótesisPrueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Cálculo de las frecuencias Esperadas ECálculo de las frecuencias Esperadas Eii::
Un estimador para la media Un estimador para la media µµ de la distribución de Poisson de la distribución de Poisson es la media muestral, es decir, es la media muestral, es decir, (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando este (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando este valor de m obtenemos la siguiente tabla de frecuencias valor de m obtenemos la siguiente tabla de frecuencias esperadas:esperadas:
xx 00 11 22 33 4 o más4 o másF(x)F(x) 0.4720.472 0.3540.354 0.1330.133 0.0330.033 0.00730.0073EEii 28.3228.32 21.2421.24 7.987.98 1.981.98 0.440.44
Para evitar que las últimas dos frecuencias esperadas sean Para evitar que las últimas dos frecuencias esperadas sean menores que 5 combinamos las últimas tres celdas para menores que 5 combinamos las últimas tres celdas para obtener:obtener:
xx 00 11 2 o más2 o másEEii 28.3228.32 21.2421.24 10.4410.44OOii 3232 1515 1313
Pruebas de HipótesisPruebas de HipótesisPrueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Variable de interés: La forma de distribución de los Variable de interés: La forma de distribución de los defectos en tarjetas de circuito impresodefectos en tarjetas de circuito impreso
HH00: La distribución es de Poisson : La distribución es de Poisson H1: La distribución No es PoissonH1: La distribución No es Poisson αα = 0.05= 0.05 El estadístico de prueba es , el cual El estadístico de prueba es , el cual
tiene una distribución tiene una distribución χχ22 con k-p-1=3-1-1=1 grado de con k-p-1=3-1-1=1 grado de libertadlibertad
Se rechazará HSe rechazará H00 si si χχ22> > χχ22 0.05,10.05,1=3.84=3.84 CálculosCálculos
χχ22= (94-100)= (94-100)22/28.32+(93-100)/28.32+(93-100)22/21.24+(94-100)/21.24+(94-100)22/10.44 = /10.44 = 2.942.94
9)9) Conclusiones: como 2.94 < 3.84. No es posible rechazar Conclusiones: como 2.94 < 3.84. No es posible rechazar la hipótesis. Por lo tanto parece ser que la distribución la hipótesis. Por lo tanto parece ser que la distribución de defectos en las placas de circuito impreso es Poissonde defectos en las placas de circuito impreso es Poisson
El valor P de la prueba es P=0.9861El valor P de la prueba es P=0.9861
∑=
−=k
1i i
2ii2
E
)E(Oχ
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Ejemplo 3Ejemplo 3.- Se desea determinar con .- Se desea determinar con αα=0.05 si el voltaje de =0.05 si el voltaje de salida de una fuente de alimentación está descrito por una salida de una fuente de alimentación está descrito por una distribución Normal. Se toma una muestra aleatoria de distribución Normal. Se toma una muestra aleatoria de N=100 fuentes, determinándose los siguientes valores N=100 fuentes, determinándose los siguientes valores muestrales x = 5.04, s = 0.08.muestrales x = 5.04, s = 0.08.
Para evitar valores de frecuencias esperadas muy Para evitar valores de frecuencias esperadas muy pequeños, de antemano se elige el ancho de los intervalos pequeños, de antemano se elige el ancho de los intervalos de clase de manera que la de clase de manera que la frecuencia esperada sea frecuencia esperada sea constante constante FFi i = N / k= N / k..
Así, si k=8 clases, se buscarán 8 intervalos de clase que Así, si k=8 clases, se buscarán 8 intervalos de clase que dividan la curva de densidad normal en 8 áreas iguales, dividan la curva de densidad normal en 8 áreas iguales, como se muestra en la siguiente figura para media 0 y como se muestra en la siguiente figura para media 0 y varianza 1.varianza 1.
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Para la distribución N(0,1) los límites de los 8 intervalos sonPara la distribución N(0,1) los límites de los 8 intervalos son – –∞∞, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+∞∞,,
por lo tanto para el ejemplo, los límites sonpor lo tanto para el ejemplo, los límites son – –∞∞, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+∞∞
Con esta elección se obtiene la siguiente tabla de Con esta elección se obtiene la siguiente tabla de frecuencias para la muestrafrecuencias para la muestra
-4 -3 -2 -1 0 1 2 3 40
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
Intervalo de ClaseIntervalo de Clase OOii EEii
De –De –∞∞ a 4.948a 4.948
De 4.948 a 4.986De 4.948 a 4.986
De 4.986 a 5.014De 4.986 a 5.014
De 5.014 a 5.040De 5.014 a 5.040
De 5.040 a 5.066De 5.040 a 5.066
De 5.066 a 5.094De 5.066 a 5.094
De 5.094 a 5.132De 5.094 a 5.132
De 5.132 a + De 5.132 a + ∞∞
1212
1414
1212
1313
1212
1111
1212
1414
12.512.5
12.512.5
12.512.5
12.512.5
12.512.5
12.512.5
12.512.5
12.512.5
Suma:Suma: 100100 100100
Pruebas de HipótesisPruebas de Hipótesis
Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste
UMSNH - UMSNH - FIEFIE
La variable de interés es el tipo de distribución del La variable de interés es el tipo de distribución del voltaje dado por una fuente de alimentaciónvoltaje dado por una fuente de alimentación
HH00: El tipo de distribución es Normal: El tipo de distribución es Normal HH11: El tipo de distribución no es Normal: El tipo de distribución no es Normal αα = 0.05= 0.05 El estadístico de prueba esEl estadístico de prueba es Para determinar los intervalos de clase se requirió Para determinar los intervalos de clase se requirió
estimar estimar µµ y y σσ, por lo tanto los grados de libertad son k-, por lo tanto los grados de libertad son k-p-1=8-2-1=5, por lo tanto se rechazará Hp-1=8-2-1=5, por lo tanto se rechazará H00 si si χχ2 2 > > χχ22
0.05,5 0.05,5 = =
11.0711.07 Cálculos:Cálculos:χχ2 2 = ( = ( 11//12.5 12.5 )[(12-12.5))[(12-12.5)22+(14-12.5)+(14-12.5)22+...+(14-12.5)+...+(14-12.5)22] = 0.64] = 0.64
9)9) Conclusiones: como 0.64<11.07, no es posible rechazar Conclusiones: como 0.64<11.07, no es posible rechazar H0, por lo tanto no hay evidencia fuerte de que la H0, por lo tanto no hay evidencia fuerte de que la distribución no sea Normal.distribución no sea Normal.El valor P de la prueba (para El valor P de la prueba (para χχ2 2 = 0.64) es P=0.9861.= 0.64) es P=0.9861.
∑=
−=k
1i i
2ii2
E
)E(Oχ
Pruebas de HipótesisPruebas de Hipótesis
Gráfica de ProbabilidadGráfica de Probabilidad
UMSNH - UMSNH - FIEFIE
La gráfica de probabilidad es un La gráfica de probabilidad es un método gráficométodo gráfico que que permite determinar si una muestra de datos se ajusta a una permite determinar si una muestra de datos se ajusta a una distribución propuesta en base a una análisis visual distribución propuesta en base a una análisis visual subjetivo.subjetivo.Originalmente esta gráfica se realizaba sobre un papel Originalmente esta gráfica se realizaba sobre un papel especial llamado especial llamado papel de probabilidadpapel de probabilidad diseñado con las diseñado con las escalas adecuadas para las diferentes distribuciones.escalas adecuadas para las diferentes distribuciones.
ProcedimientoProcedimiento:: Se ordena la muestra de menor a mayor: xSe ordena la muestra de menor a mayor: x11,x,x22,....,x,....,xNN Se grafica sobre el papel de probabilidad la frecuencia Se grafica sobre el papel de probabilidad la frecuencia
acumulada observada (i-0.5)/N contra el valor de los acumulada observada (i-0.5)/N contra el valor de los datos ordenadosdatos ordenados
Si los puntos obtenidos se devían sif¿gnificativamente Si los puntos obtenidos se devían sif¿gnificativamente de una línea recta, el modelo propuesto no será el de una línea recta, el modelo propuesto no será el apropiado.apropiado.
Pruebas de HipótesisPruebas de Hipótesis
Gráfica de ProbabilidadGráfica de Probabilidad
UMSNH - UMSNH - FIEFIE
EjemploEjemplo: Las siguientes son diez observaciones sobre la : Las siguientes son diez observaciones sobre la duración en minutos de las baterías de computadoras duración en minutos de las baterías de computadoras portátiles: portátiles:
176, 183, 185, 190, 191, 192, 201, 205, 214, 220176, 183, 185, 190, 191, 192, 201, 205, 214, 220Utilizar la gráfica de probabilidad para determinar si la Utilizar la gráfica de probabilidad para determinar si la muestra corresponde a una distribución Normal.muestra corresponde a una distribución Normal.
i 1 2 3 4 5 6 7 8 9 10
xi 176 183 185 190 191 192 201 205 214 220
(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95
ProcedimientoProcedimiento: Formamos la tabla de los datos ordenados : Formamos la tabla de los datos ordenados y las frecuencias acumuladas (i-0.5)/N siguiente:y las frecuencias acumuladas (i-0.5)/N siguiente:
Pruebas de HipótesisPruebas de Hipótesis
Gráfica de ProbabilidadGráfica de Probabilidad
UMSNH - UMSNH - FIEFIE
175 180 185 190 195 200 205 210 215 220
0.05 0.05
0.10 0.10
0.25 0.25
0.50 0.50
0.75 0.75
0.90 0.90
0.95 0.95
Datos (XDatos (X ii))
Fre
cue
nci
a a
cum
ula
da
(i-
0.5
)/N
Fre
cue
nci
a a
cum
ula
da
(i-
0.5
)/N
Gráfica de Probabilidad NormalGráfica de Probabilidad Normal
00.0.0
1.01.0
µ≈195
0.0.8484
σ≈16
Pruebas de HipótesisPruebas de Hipótesis
Gráfica de ProbabilidadGráfica de Probabilidad
UMSNH - UMSNH - FIEFIE
ObservacionesObservaciones: : Al analizar la gráfica debe recordarse que el eje vertical Al analizar la gráfica debe recordarse que el eje vertical
está graduado en está graduado en percentilespercentiles, por ello la media se , por ello la media se encuentra en el percentil 50.encuentra en el percentil 50.
Los puntos más confiables son los que están entre el Los puntos más confiables son los que están entre el percentil 25 y el 75, de hecho, la linea trazada debe unir percentil 25 y el 75, de hecho, la linea trazada debe unir estos percentilesestos percentiles
Se puede obtener una Se puede obtener una gráfica sobre papel normalgráfica sobre papel normal ajustando la escala vertical de acuerdo a zajustando la escala vertical de acuerdo a zii, donde , donde ΦΦ(z(zii) )
= (i-0.5)/N, para el ejemplo:= (i-0.5)/N, para el ejemplo:i 1 2 3 4 5 6 7 8 9 10
(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95
zi -1.64 -1.04 -0.67 -0.39 -0.13 0.13 0.39 0.67 1.04 1.64
4)4) En Matlab se puede usar la función En Matlab se puede usar la función normplotnormplot
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
Una Una tabla de contingenciatabla de contingencia es una herramienta que nos es una herramienta que nos permite poner a prueba si permite poner a prueba si dos criterios de clasificación de dos criterios de clasificación de una misma muestrauna misma muestra son independientes o no, por ejemplo: son independientes o no, por ejemplo:
Población Criterio 1 Criterio 2
Ingenieros recién egresados Salario inicial Institución de origen
Estudiantes Nivel Socioeconómico Promedio académico
Número de fallas en un proceso
Maquinaria utilizada Turno
Estudiantes Calif. en Materia 1 Calif. en Materia 2
Fallas en un transformador Tipo de falla Ubicación
Etc...
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
ProcedimientoProcedimiento::Se forma una tabla de frecuencias observadas Oij, donde:Se forma una tabla de frecuencias observadas Oij, donde: i=No. de renglón= nivel de clasificación i del criterio 1 (i=1,2,,3,...,r)i=No. de renglón= nivel de clasificación i del criterio 1 (i=1,2,,3,...,r) j=No. de columna= nivel de clasificación j del Criterio 2 (j=1,2,3,...,c)j=No. de columna= nivel de clasificación j del Criterio 2 (j=1,2,3,...,c)
Criterio2
Criterio1Nivel 1 Nivel 2 ... Nivel c
Nivel 1 O11 O12 O1c
Nivel 2 O21 O22 O2c
... ...
Nivel r Or1 Or1 ... Orc
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
ConsideracionesConsideraciones: : Si los criterios son independientes (Hipótesis Si los criterios son independientes (Hipótesis Nula)Nula): La probabilidad de que un elemento elegido al azar caiga : La probabilidad de que un elemento elegido al azar caiga en la ij-ésima celda es en la ij-ésima celda es ppijij=u=uii v vjj,,donde donde uuii= probabilidad de que caiga en el renglón i= probabilidad de que caiga en el renglón i
uujj= probabilidad de que caiga en la columna j= probabilidad de que caiga en la columna j
Son estimadores para Son estimadores para uuii, , vvjj : :
Por lo tanto, la frecuencia esperada en cada celda es Por lo tanto, la frecuencia esperada en cada celda es EEij ij = Np= Npij ij = = NuNuiivvjj, es decir, es decir
∑=
=c
1jijN
1i Ou ∑
=
=r
1iijN
1j Ov
∑∑==
=r
1iij
c
1jijN
1ij OOE
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
Para N grande el siguiente estadísticoPara N grande el siguiente estadístico
Tiene una distribución JiTiene una distribución Ji22 con (r-1)(c-1) grados de libertad siempre con (r-1)(c-1) grados de libertad siempre que la Hipótesis nula sea verdadera.que la Hipótesis nula sea verdadera.
Por lo tanto, la Hipótesis de independencia se deberá rechazar si Por lo tanto, la Hipótesis de independencia se deberá rechazar si el estadístico el estadístico χχ22 > > χχ22
αα,(r-1)(c-1),(r-1)(c-1). .
∑∑==
−=
r
1i ij
2ijij
c
1j
2
E
)E(Oχ
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
EjemploEjemplo: Los empleados de una compañía eligen uno de tres : Los empleados de una compañía eligen uno de tres posibles planes de pensión. La gerencia desea saber con posibles planes de pensión. La gerencia desea saber con αα=0.05 si =0.05 si la preferencia en la elección es independiente de la clasificación la preferencia en la elección es independiente de la clasificación del contrato (asalariados y por horas). De una muestra aleatoria del contrato (asalariados y por horas). De una muestra aleatoria de 500 empleados se obtiene la siguiente tabla de contingenciade 500 empleados se obtiene la siguiente tabla de contingencia
Tipo de contratoTipo de contrato Plan 1Plan 1 Plan 2Plan 2 Plan 3Plan 3 TotalTotal
AsalariadosAsalariados 160160 140140 4040 340340
Por HorasPor Horas 4040 6060 6060 160160
TotalTotal 200200 200200 100100 500500
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
SoluciónSolución: Necesitaremos las frecuencias esperadas, para ello : Necesitaremos las frecuencias esperadas, para ello calculamos estimados de ucalculamos estimados de uii, v, vjj para i=1,2, j=1,2,3: para i=1,2, j=1,2,3:
uu11=0.68,=0.68, uu22=0.32,=0.32,vv11=0.4,=0.4, vv22=0.4,=0.4, vv33=0.2=0.2
Tipo de contratoTipo de contrato Plan 1Plan 1 Plan 2Plan 2 Plan 3Plan 3 TotalTotal
AsalariadosAsalariados 136136 136136 6868 340340
Por HorasPor Horas 6464 6464 3232 160160
TotalTotal 200200 200200 100100 500500
Con esto calculamos las frecuencias esperadas, por ejemploCon esto calculamos las frecuencias esperadas, por ejemploEE1111= Nu= Nu11vv11=500(0.68)(0.4)=136=500(0.68)(0.4)=136
El resto se muestran en la siguiente tablaEl resto se muestran en la siguiente tabla
Pruebas de HipótesisPruebas de Hipótesis
Tablas de ContingenciaTablas de Contingencia
UMSNH - UMSNH - FIEFIE
La variable de interés es la preferencia de los empleados por La variable de interés es la preferencia de los empleados por los planes de pensiónlos planes de pensión
HH00: La preferencia es independiente del tipo de contrato: La preferencia es independiente del tipo de contrato HH11: La preferencia no es independiente del tipo de contrato: La preferencia no es independiente del tipo de contrato αα=0.05=0.05 El estadístico de prueba esEl estadístico de prueba es Como r=2, c=1, Como r=2, c=1, χχ22 tiene 2 grados de libertad, por lo tanto H0 tiene 2 grados de libertad, por lo tanto H0
debe rechazarse si debe rechazarse si χχ22> > χχ220.05,20.05,2=5.99=5.99
Cálculos: Cálculos: χχ2 2 = 49.63= 49.63 Como 49.63>5.99, Se rechaza la hipótesis de independencia. Como 49.63>5.99, Se rechaza la hipótesis de independencia.
El valor P para El valor P para χχ2 2 = 49.63 es P=1.671x= 49.63 es P=1.671x10-1110-11
∑∑==
−=
r
1i ij
2ijij
c
1j
2
E
)E(Oχ