diseño de invstigacion

DISEÑOS DE INVESTIGACION EPIDEMIOLOGICA

revisaremos dos ideas centrales:

qué es un diseño de investigación en epidemiología

y qué criterios se utilizan para clasificarlos.

HOLA!

Un diseño de investigación es un esquema de procedimientos, donde el investigador define las estrategias que aplicará para formular el problema de estudio y para resolverlo.

La epidemiología cuenta con un buen número de diseños de investigación, algunos más usados que otros.


Para clasificar los diseños, la epidemiología utiliza cuatro criterios:

El alcance que persigue la investigación

La relación que el investigador establece con el fenómeno en estudio

La direccionalidad del análisis causal, y

La disponibilidad de los datos

Los dos primeros criterios diferencian los diseños básicos.

Los dos últimos permiten identificar variaciones al interior de cada diseño.

Veamos su s características uno a uno.


Según la relación que el investigador establece con el fenómeno en estudio, las investigaciones epidemiológicas pueden ser de dos tipos

Cuando el investigador decide que va a observar el fenómeno en sus condiciones, habituales, procurando no modificarlo

OBSERVACIONALES

DE INTERVENCIÓN

Cuando el investigador decide observar la respuesta del fenómeno a ciertos cambios que él manipula voluntaria y cuidadosamente.


Según su alcance, los estudios epidemiológicos pueden ser de dos tipos:

Cuando el interés principal del investigador es relatar los atributos o características principales del fenómeno. Dependiendo del fenómeno a estudiar, esta descripción podrá ser Cualitativa o Cuantitativa

DESCRIPTIVOS

ANALÍTICOS

Cuando el interés principal del investigador es explicar la relación que puede existir entre dos o más características del fenómeno

En todo estudio analìtico habrá, como mínimo, dos variables que el analista quiere relacionar: una “variable independiente” o posible causa y una “variable dependiente o” posible efecto


A su vez, los diseños analíticos pueden diferenciarse, según la direccionalidad del análisis, en tres categorías:

ANALISIS HACIA ADELANTE

ANÁLISIS HACIA ATRÁS

ANÁLISIS ADIRECCIONALES


Cuando el investigador tiene información sobre una variable posiblemente explicativa y quiere relacionarla con un efecto en el mismo sujeto.

Decimos que hay un análisis “hacia delante”

El modelo utilizado para establecer la asociación, parte de la causa y va hacia el efecto

Una posible causa

Ej: el hecho de tener una

pareja fumadora

Un efecto Ej: el desarrollo de cáncer de

pulmón

¿ Se asocia con algo que ocurre

después?


El modelo diseñado para establecer la asociación, parte del efecto y va hacia la causa

Decimos que hay un análisis “hacia atrás”

Cuando el investigador tiene información sobre una variable que pudiera considerarse efecto, y quiere saber si está relacionada con un acontecimiento que ocurrió antes al mismo sujeto

Un efecto Ej: El diagnóstico de cáncer de

pulmón

Una posible causa

Ej: El antecedente de exposición a una pareja fumadora

¿ Se asocia con algo que ocurrió

antes?


Un cuarto criterio para clasificar los diseños epidemiológicos se refiere a la disponibilidad del dato. Según este criterio los estudios pueden ser

Cuando el investigador se basa en datos que ya existen. En consecuencia el estudio tendrá que acomodarse al dato tal como fue registrado.

RETROSPECTIVOS

PROSPECTIVOS

Cuando el dato aún no existe o es deficiente, y el invetigador decide generarlo para el estudio. En este caso el investigador podrá obtener la información tal como él la necesita.

Combinan registros existentes y datos por obtener

AMBISPECTIVOS


RECAPITULANDO

En esta lección hemos revisado las variantes que pueden presentar los diseños epidemiológicos y cuya combinación permite clasificarlos.

Según acción del investigador

Observar el fenómeno

Intervenir el fenómeno

Según alcance del estudio

Describir el fenómeno

Analizar sus causas

Según tipode Análisis

Hacia el efecto

Hacia la causa

Según disponibilidad

del dato

Revisar el dato

Generar el dato

Sin dirección

Usar ambos

En las próximas lecciones, revisaremos cada uno de los diseños básicos utilizados en epidemiología


Para avanzar en el tema te recomendamos revisar el siguiente material

Clasificación de los diseños de investigación en epidemiología

Luego de revisar los documentos anteriores , y una VEZ ESCRITA LA ,MONOGRAFÍA PLANTEA LA PREGUNTA E INICIA


http://guajiros.udea.edu.co/Eva/Cursos/Observac/Clasificacion .zip

http://guajiros.udea.edu.co/Eva/Cursos/Observac/Clasificacion.pdf

Establecer relación entre variables antes no descritas

Caracterizar las variables

Dependiente Independiente Diseñar la hipótesis

Hipótesis de trabajo

Enunciado ortográfico

Pruebas de HipótesisPruebas de HipótesisIntroducciónIntroducción

UMSNH - UMSNH - FIEFIE

La experiencia sobre el comportamiento de algún índice de La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar norma nos lleva a realizar proposiciones sobre el valor de proposiciones sobre el valor de algún parámetro estadísticoalgún parámetro estadístico. . Estas proposiciones se deben contrastar con la realidad Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposiciónentre aceptar o rechazar la proposición

Estas proposiciones se denominan Estas proposiciones se denominan HipótesisHipótesis y el y el procedimiento para decidir si se aceptan o se rechazan se procedimiento para decidir si se aceptan o se rechazan se denomina denomina Prueba de HipótesisPrueba de HipótesisUna prueba de hipótesis es una herramienta de análisis de Una prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un datos que puede en general formar parte de un experimento comparativoexperimento comparativo más completo más completo

Pruebas de HipótesisPruebas de Hipótesis

IntroducciónIntroducción


Una Una hipótesis Estadísticahipótesis Estadística es un proposición sobre los es un proposición sobre los parámetros de una población o sobre la distribución de parámetros de una población o sobre la distribución de probabilidad de una variable aleatoriaprobabilidad de una variable aleatoria

EjemploEjemplo: Se tiene interés en la rapidez de combustión de un agente : Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribución de (esta rapidez es una variable aleatoria con alguna distribución de probabilidad). Especialmente interesa la rapidez de combustión probabilidad). Especialmente interesa la rapidez de combustión promedio (que es un parámetro (promedio (que es un parámetro (µµ) de dicha distribución). De manera ) de dicha distribución). De manera más específica, interesa decidir si esta rapidez promedio es o no 50 más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg.cm/seg.El planteamiento formal de la situación se realiza en términos de una El planteamiento formal de la situación se realiza en términos de una Hipótesis NulaHipótesis Nula (que es la proposición que se quiere poner a prueba) y (que es la proposición que se quiere poner a prueba) y una una Hipótesis AlternativaHipótesis Alternativa, la cual se aceptará si se rechaza la hipótesis , la cual se aceptará si se rechaza la hipótesis nula:nula:

Hipótesis Nula: Hipótesis Nula: HH00: : µµ = 50 cm/seg = 50 cm/seg

Hipótesis Alternativa:Hipótesis Alternativa: HH11: : µµ ≠≠ 50 cm/seg 50 cm/seg• En el ejemplo se tiene una En el ejemplo se tiene una Hipótesis Alternativa BilateralHipótesis Alternativa Bilateral, ya que se , ya que se verifica para valores de verifica para valores de µµ a ambos lados de 50 cm/seg. a ambos lados de 50 cm/seg.




En ocasiones interesa una En ocasiones interesa una Hipótesis Alternativa UnilateralHipótesis Alternativa Unilateral, , Por ejemplo:Por ejemplo:

HH00: : µµ = 50 cm/seg = 50 cm/seg HH00: : µµ = 50 cm/seg = 50 cm/seg

HH11: : µµ < 50 cm/seg < 50 cm/seg HH11: : µµ > 50 cm/seg > 50 cm/seg¿De donde puede surgir una Hipótesis Nula sobre un ¿De donde puede surgir una Hipótesis Nula sobre un

parámetro?parámetro?¿Cuál sería el interés dependiendo del origen de la ¿Cuál sería el interés dependiendo del origen de la

hipótesis?hipótesis?• OrigenOrigen: Experiencia, pruebas pasadas o conocimiento del proceso. : Experiencia, pruebas pasadas o conocimiento del proceso.

InterésInterés: averiguar si ha cambiado el parámetro: averiguar si ha cambiado el parámetro• OrigenOrigen: Alguna teoría o modelo sobre el funcionamiento del : Alguna teoría o modelo sobre el funcionamiento del

proceso. proceso. InterésInterés: Verificar la validés de dicha teoría: Verificar la validés de dicha teoría• Origen: Origen: Especificaciones de diseño, obligaciones contractuales, Especificaciones de diseño, obligaciones contractuales,

normas a cumplir o solicitudes del cliente.normas a cumplir o solicitudes del cliente. Interés: Interés: probar el probar el cumplimiento o incumplimiento de las especificaciones.cumplimiento o incumplimiento de las especificaciones.

La verdad o falsedad de la hipótesis NO puede La verdad o falsedad de la hipótesis NO puede conocerse con total seguridad a menos que pueda conocerse con total seguridad a menos que pueda examinarse toda la poblaciónexaminarse toda la población

óó




Procedimiento General para la prueba de una hipótesisProcedimiento General para la prueba de una hipótesis

Tomar un Tomar un muestramuestra aleatoriaaleatoria

Calcular un Calcular un estadísticoestadístico basado en la muestra basado en la muestra

Usar el estadístico y sus propiedades para tomar una Usar el estadístico y sus propiedades para tomar una decisióndecisión sobre la Hipótesis Nula sobre la Hipótesis Nula

Pruebas de HipótesisPruebas de HipótesisIntroducciónIntroducción


EjemploEjemplo: Consideremos el ejemplo anterior de la rapidez de : Consideremos el ejemplo anterior de la rapidez de combustión. Aquí se tenía:combustión. Aquí se tenía: HH00: : µµ = 50 cm/seg = 50 cm/seg

HH11: : µµ ≠≠ 50 cm/seg 50 cm/seg

Aceptación de HAceptación de H00.- Un valor de la media muestral .- Un valor de la media muestral xx “muy “muy

cercano” a 50 cm/seg es una evidencia que apoya a la cercano” a 50 cm/seg es una evidencia que apoya a la hipótesis nula, sin embargo hipótesis nula, sin embargo es necesario introducir un es necesario introducir un criteriocriterio para decidir que tanto es muy cercano, para el para decidir que tanto es muy cercano, para el ejemplo este criterio pudiera ser: ejemplo este criterio pudiera ser: 48.5 48.5 ≤≤ x x ≤≤ 51.5, 51.5, si esto si esto ocurre se acepta Hocurre se acepta H00 De lo contrario, es decir, si De lo contrario, es decir, si x <x < 48.5 o x >51.5, 48.5 o x >51.5, se acepta se acepta

HH11

__

__

__ __

48.548.5 50 50 51.5 51.5

Región Crítica Región Crítica Región de aceptaciónRegión de aceptación Región Crítica Región CríticaSe acepta HSe acepta H11 Se acepta HSe acepta H00 Se acepta H Se acepta H11

µµ ≠≠ 50 50 µµ = 50 = 50 µµ ≠≠ 50 50

Valores CríticosValores Críticos


Errores Tipo I y Tipo IIErrores Tipo I y Tipo II


El procedimiento anterior puede llevarnos a una de dos El procedimiento anterior puede llevarnos a una de dos conclusiones erróneas:conclusiones erróneas:

Error Tipo IError Tipo I.- Se rechaza H.- Se rechaza H00 cuando ésta es verdadera cuando ésta es verdadera

En el ejemploEn el ejemplo se cometerá un error de tipo I cuando se cometerá un error de tipo I cuando µµ=50=50, , pero pero xx para la muestra considerada cae en la región crítica para la muestra considerada cae en la región críticaY se cometerá un error de tipo II cuando Y se cometerá un error de tipo II cuando µ ≠µ ≠ 50 50 pero pero xx para para la muestra considerada cae en la región de aceptación la muestra considerada cae en la región de aceptación

Error Tipo IIError Tipo II.- Se acepta H.- Se acepta H00 cuando ésta es falsa cuando ésta es falsa__

__

Condición realCondición real

DecisiónDecisiónHH00 verdadera verdadera HH00 falsa falsa

Rechazar HRechazar H00 Error Tipo IError Tipo I okok

Aceptar HAceptar H00 okok Error Tipo IIError Tipo II


Error Tipo IError Tipo I


A la probabilidad de cometer un error de Tipo I se denota A la probabilidad de cometer un error de Tipo I se denota por por αα, y se le llama el nivel o , y se le llama el nivel o tamaño de significanciatamaño de significancia de la de la prueba es decirprueba es decir

αα = P(error Tipo I)= P(rechazar H= P(error Tipo I)= P(rechazar H0 0 | H| H00 es verdadera) es verdadera)EjemploEjemplo: Calcular : Calcular αα para el ejemplo de la rapidez de combustión para para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es de la rapidez de combustión es σσ=2.5 cm/seg.=2.5 cm/seg.

__

αα = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))= normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79)) = 0.288+ 0.288 = = 0.288+ 0.288 = 0.05760.0576

Esto significa que el 5.76% de las muestras de tamaño 10 Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis Hconducirán al rechazo de la Hipótesis H00: : µµ=50 cm/seg, cuando ésta =50 cm/seg, cuando ésta

es verdaderaes verdadera..

SoluciónSolución: en este caso : en este caso αα = P( x caiga en la región crítica | = P( x caiga en la región crítica | µµ=50), es =50), es decir:decir:

αα = P( x < 48.5) + P( x > 51.5)= P( x < 48.5) + P( x > 51.5)RecordandoRecordando que La distribución de x es Normal con media que La distribución de x es Normal con media µ=50 µ=50 y y desviación estándar desviación estándar σσ//√√N =0.79, por lo tanto, usando Matlab: N =0.79, por lo tanto, usando Matlab:

__ ____


Error Tipo IError Tipo I


Es claro que Es claro que αα se puede reducir de dos maneras: se puede reducir de dos maneras:- Aumentando la región de aceptación- Aumentando la región de aceptación- Aumentando el tamaño de la muestra- Aumentando el tamaño de la muestra

EjemploEjemplo: recalcular : recalcular αα del ejemplo anterior para a) los nuevos límites de del ejemplo anterior para a) los nuevos límites de la región de aceptación 48 y 52. b) Para N=16 con los límites la región de aceptación 48 y 52. b) Para N=16 con los límites originales c) con ambas modificacionesoriginales c) con ambas modificaciones

SoluciónSolución::a) a) αα = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = =

0.01140.0114b) b) αα = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = =

0.01640.0164

c) c) αα = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = = 0.00140.0014


Error tipo IIError tipo II


Para evaluar un experimento de prueba de hipótesis Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de también se requiere calcular la probabilidad del error de Tipo II, denotada por Tipo II, denotada por ββ, es decir, es decir

ββ = P(error Tipo II) = P(aceptar H= P(error Tipo II) = P(aceptar H00 | H | H00 es falsa) es falsa)Sin embargo, no es posible calcular Sin embargo, no es posible calcular ββ si no se tiene una si no se tiene una hipótesis alternativa específica, es decir, un valor particular hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valoresdel parámetro bajo prueba en lugar de un rango de valores

Por ejemploPor ejemplo, supongamos que es importante rechazar H, supongamos que es importante rechazar H00 si si

la rapidez promedio de combustión la rapidez promedio de combustión µµ es mayor que 52 cm/ es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar Hrequiere evaluar la probabilidad de aceptar H00: : µµ=50 =50

cuando el valor verdadero es cuando el valor verdadero es µµ=52.=52.




45 46 47 48 49 50 51 52 53 54 550

0.1

0.2

0.3

0.4

0.5

0.6

0.7

H0: H0: µµ=50=50

H1: H1: µµ=52=52

Usando Matlab:Usando Matlab: ββ = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.26430.2643

De acuerdo a la figura: De acuerdo a la figura: ββ = P(48.5 = P(48.5 ≤≤ x x ≤≤ 51.5 | 51.5 | µµ=52)=52)__




Usando Matlab:Usando Matlab: ββ = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = = normcdf(51.5,50.5,0.79) - normcdf(48.5,50.5,0.79) = 0.89230.8923

La probabilidad de obtener un error de tipo II aumenta muy La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero rápido a medida que el valor verdadero µµ tiende al valor tiende al valor hipotético, por ejemplo, si suponemos que hipotético, por ejemplo, si suponemos que µµ=50.5, y =50.5, y recalculamos recalculamos ββ, obtenemos, obtenemos

ββ también depende del tamaño de la muestra, por ejemplo, también depende del tamaño de la muestra, por ejemplo, si N=16 obtenemos en el ejemplo cuando si N=16 obtenemos en el ejemplo cuando µµ=52: =52: σσ=0.625, =0.625, por lo tantopor lo tanto ββ = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = = normcdf(51.5,52,0.625) - normcdf(48.5,52,0.625) = 0.21190.2119

Es decir, Es decir, ββ disminuye cuando N aumenta, excepto si el disminuye cuando N aumenta, excepto si el valor real de valor real de µµ está muy cerca del hipotético está muy cerca del hipotético


Conclusiones Fuerte y DébilConclusiones Fuerte y Débil


Es por eso que Es por eso que el rechazo de Hel rechazo de H00 siempre se considera siempre se considera

como una como una Conclusión FuerteConclusión Fuerte. (los datos aportan fuerte . (los datos aportan fuerte evidencia de que Hevidencia de que H00 es falsa) es falsa)

Como uno puede elegir los valores críticos del intervalo de Como uno puede elegir los valores críticos del intervalo de aceptación aceptación uno controla el valor de uno controla el valor de αα. Uno puede entonces . Uno puede entonces controlar la probabilidad de rechazar de manera errónea controlar la probabilidad de rechazar de manera errónea HH00..

La decisión de La decisión de aceptar Haceptar H00 se considera una se considera una Conclusión Conclusión

DébilDébil, a menos que se sepa que , a menos que se sepa que ββ es considerablemente es considerablemente pequeño.pequeño.

Por esto en lugar de decir “Por esto en lugar de decir “se acepta Hse acepta H00” se prefiere decir ” se prefiere decir

““incapaz de rechazar Hincapaz de rechazar H00”, es decir, no se ha encontrado ”, es decir, no se ha encontrado

evidencia suficiente para rechazar Hevidencia suficiente para rechazar H00. O sea, . O sea, no quiere no quiere

decir que exista gran evidencia de que Hdecir que exista gran evidencia de que H 00 sea cierta sino sea cierta sino

que no hay gran evidencia de que sea falsaque no hay gran evidencia de que sea falsa..


Hipótesis UnilateralesHipótesis Unilaterales


HH00: : µµ=50 cm/seg=50 cm/seg

HH11: : µµ<50 cm/seg<50 cm/seg

En el ejemplo supongamos que si la rapidez media de En el ejemplo supongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿cómo deben plantearse esto con una conslusión fuerte. ¿cómo deben plantearse las hipótesis?las hipótesis?

Nótese que aunque HNótese que aunque H00 está planteada como una igualdad, está planteada como una igualdad,

se sobre-entiende que incluye cualquier valor de se sobre-entiende que incluye cualquier valor de µµ no no especificado por Hespecificado por H11, es decir, , es decir, la incapacidad de rechazar la incapacidad de rechazar

HH00 no significa que no significa que µµ=50, sino que no se tiene evidencia =50, sino que no se tiene evidencia

fuerte que apoye a Hfuerte que apoye a H11, , es decires decir, pudiera ser que , pudiera ser que µµ=50=50 o o

que que µµ>50>50




EjemploEjemplo: Un embotellador de refresco desea estar seguro : Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor de que las botellas que usa tienen en promedio un valor que supera el mínimo de présión de estallamiento de 200 que supera el mínimo de présión de estallamiento de 200 psi. El embotellador puede formular una prueba de psi. El embotellador puede formular una prueba de hipótesis de dos maneras:hipótesis de dos maneras:

Con el planteamiento (1) Como el rechazo de HCon el planteamiento (1) Como el rechazo de H00 es una es una

conclusión fuerte, esto obliga al fabricante a demostrar conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor (aportar evidencia) de que las botellas soportan mayor presión que 200 psipresión que 200 psi

HH00: : µµ=200 psi=200 psi HH00: : µµ=200 psi=200 psi

HH11: : µµ>200 psi>200 psi HH11: : µµ<200 psi<200 psi(1)(1)(2)(2)

Con el planteamiento (2) si se rechaza HCon el planteamiento (2) si se rechaza H00 se concluye que se concluye que

las botellas no soportan los 200 psi, es decir, se concluye las botellas no soportan los 200 psi, es decir, se concluye que las botellas son satisfactorias a menos que halla que las botellas son satisfactorias a menos que halla evidencia fuerte en sentido contrarioevidencia fuerte en sentido contrario

¿cuál planteamiento es el correcto?¿cuál planteamiento es el correcto?




Es decir, en la Hipótesis alternativa se debe poner Es decir, en la Hipótesis alternativa se debe poner la proposición sobre la cual es importante llegar a la proposición sobre la cual es importante llegar a una conclusión fuerte:una conclusión fuerte:

HH00: : µµ=200 psi=200 psi HH00: : µµ=200 psi=200 psi

HH11: : µµ>200 psi>200 psi HH11: : µµ<200 psi<200 psi(1)(1)(2)(2)


Procedimiento general para la prueba de Procedimiento general para la prueba de HipótesisHipótesis


Antes de Examinar los datos muestrales:Antes de Examinar los datos muestrales:1.1. Identificar el parámetro de interésIdentificar el parámetro de interés2.2. Establecer la Hipótesis Nula HEstablecer la Hipótesis Nula H00

3.3. Especificar una Hipótesis alternativa adecuada HEspecificar una Hipótesis alternativa adecuada H11

4.4. Seleccionar un nivel de significancia Seleccionar un nivel de significancia ααUsando los datos muestrales:Usando los datos muestrales:

5. 5. Establecer un estadístico de prueba adecuadoEstablecer un estadístico de prueba adecuado6. 6. Establecer una región de rechazoEstablecer una región de rechazo7. 7. Calcular todas las cantidades muestrales Calcular todas las cantidades muestrales

necesarias para el estadísticonecesarias para el estadístico8. 8. Decidir si debe o no rechazarse HDecidir si debe o no rechazarse H00


Prueba de hipótesis sobre la media, varianza Prueba de hipótesis sobre la media, varianza conocidaconocida


Si se desea probar la Hipótesis:Si se desea probar la Hipótesis:HH00: : µ µ = = µµ00

HH11: : µ ≤µ ≤ µµ00

Se puede usar el estadístico de prueba Z siguienteSe puede usar el estadístico de prueba Z siguiente

El cual tiene una distribución Normal con media cero y El cual tiene una distribución Normal con media cero y varianza 1 (si se cumplen las suposiciones del teorema del varianza 1 (si se cumplen las suposiciones del teorema del límite central)límite central)

Nσ/

μXZ 0

__

−=




Entonces, para una Entonces, para una αα dada podemos establecer las dada podemos establecer las siguientes regiones de aceptación y crítica:siguientes regiones de aceptación y crítica:

-z-zαα/2 /2 zzαα/2/2 Z Z

αα/2 /2 αα/2/2

Región de aceptaciónRegión de aceptaciónregión crítica región críticaregión crítica región crítica

ConclusionesConclusiones::

Rechazar HRechazar H00 si: si: z < -zz < -zαα/2/2 o z > z o z > zαα/2/2

No rechazar HNo rechazar H00 si: si: - z- zαα/2/2 ≤≤ z z ≤≤ z zαα/2/2




EjemploEjemplo: Se ilustrarán los 8 pasos del procedimiento : Se ilustrarán los 8 pasos del procedimiento general para el ejemplo del combustible sólido para general para el ejemplo del combustible sólido para sistemas de escape de aeronaves. En este caso se conoce sistemas de escape de aeronaves. En este caso se conoce σσ=2 cm/seg, se desea probar si la media =2 cm/seg, se desea probar si la media µµ es de 50 es de 50 cm/seg. Se selecciona una muestra aleatoria de tamaño cm/seg. Se selecciona una muestra aleatoria de tamaño N=25, obteniendo x=51.3 cm/seg. N=25, obteniendo x=51.3 cm/seg. Se especifica un nivel de Se especifica un nivel de sginificancia sginificancia αα=0.05=0.05 ¿A qué conclusiones se debe llegar? ¿A qué conclusiones se debe llegar?

• El parámetro de interés es El parámetro de interés es µµ (rapidez promedio de (rapidez promedio de combustión)combustión)

• HH00: : µµ = 50 cm/seg = 50 cm/seg• HH11: : µµ ≠≠ 50 cm/seg 50 cm/seg∀ αα = 0.05= 0.05

__




5) La estadística de prueba es 5) La estadística de prueba es

6) Rechazar H6) Rechazar H00 si z>1.96 o si z<-1.96 si z>1.96 o si z<-1.96 (consecuencia del (consecuencia del

paso 4)paso 4)7) cálculos7) cálculos

8) Conclusión como z = 3.25 > 1.96, 8) Conclusión como z = 3.25 > 1.96, se rechaza Hse rechaza H00: : µµ = 50 = 50

cm/seg con un nivel de significancia cm/seg con un nivel de significancia αα = 0.05 = 0.05

8) Es decir, 8) Es decir, Se concluye que en base a una muestra de 25 Se concluye que en base a una muestra de 25 mediciones la rapidez promedio de combustión es mediciones la rapidez promedio de combustión es diferente de 50 cm/segdiferente de 50 cm/seg, de hecho, existe evidencia , de hecho, existe evidencia fuerte de que ésta es mayor.fuerte de que ésta es mayor.

Nσ/

μXZ 0

__

−=

25.3252/

503.51Z =−=


Valores PValores P


Una manera de notificar los resultados de una prueba de Una manera de notificar los resultados de una prueba de hipótesis es establecer si la hipótesis nula fue o no hipótesis es establecer si la hipótesis nula fue o no rechazada con un rechazada con un nivel especificado nivel especificado αα de significancia de significancia

Una alternativa es especificar Una alternativa es especificar el nivel de significancia el nivel de significancia αα más pequeño que conduce al rechazo de la hipótesis nulamás pequeño que conduce al rechazo de la hipótesis nula. . A este se le llama el A este se le llama el Valor PValor P

Este valor P sólo depende de la muestra tomada, es decir, Este valor P sólo depende de la muestra tomada, es decir, para una muestra y un estadístico calculado se puede para una muestra y un estadístico calculado se puede obtener su valor P y comparar con un obtener su valor P y comparar con un αα especificado. especificado. Entonces, Entonces, si P<si P<αα, H, H00 se rechaza se rechaza..


Valores PValores P


En el caso de la distribución normal para la pureba sobre la En el caso de la distribución normal para la pureba sobre la media es fácil calcular el valor P. Si zmedia es fácil calcular el valor P. Si z00 fue el valor calculado fue el valor calculado

del estadístico de prueba, entonces:del estadístico de prueba, entonces:

Donde Donde ΦΦ(z) = P(Z(z) = P(Z≤≤z) (Función de distribución normal z) (Función de distribución normal N(0,1))N(0,1))Para el ejemplo zPara el ejemplo z00= 3.25, entonces P=2(1-= 3.25, entonces P=2(1-ΦΦ(3.25))=0.0012. (3.25))=0.0012.

Es decir, HEs decir, H00 será rechazada con cualquier nivel de será rechazada con cualquier nivel de

significancia significancia αα ≥≥ 0.0012 0.0012

P = P =

2 [ 1- 2 [ 1- ΦΦ(|z(|z00|) ]|) ] Prueba de dos colas: HPrueba de dos colas: H00::µµ==µµ00, H, H11::µµ ≠≠ µµ00

1- 1- ΦΦ(z(z00)) Prueba de cola superior: HPrueba de cola superior: H00::µµ==µµ00, H, H11::µµ > > µµ00

ΦΦ(z(z00)) Prueba de cola inferior: HPrueba de cola inferior: H00::µµ==µµ00, H, H11::µµ < < µµ00

Si se usa el enfoque del valor P el paso 6 del procedimiento Si se usa el enfoque del valor P el paso 6 del procedimiento general de prueba de hipótesis ya no es necesario.general de prueba de hipótesis ya no es necesario.


Error Tipo II y tamaño de la muestraError Tipo II y tamaño de la muestra


Consideremos la hipótesis bilateral Consideremos la hipótesis bilateral HH00::µµ==µµ00, H, H11::µµ ≠≠ µµ0.0.

Si HSi H00 es falsa y la media verdadera es es falsa y la media verdadera es µ µ = = µµ00 + + δ δ (con(con δδ>0>0)). .

El estadístico de pruebaEl estadístico de prueba

se puede escribir como se puede escribir como

Es decir, Si HEs decir, Si H11 es verdadera Z tiene distribución Normal con es verdadera Z tiene distribución Normal con

media media y varianza 1. y varianza 1. Por lo tanto, el error Tipo 1 (Por lo tanto, el error Tipo 1 (ββ) se puede calcular como) se puede calcular como

Nσ/

μXZ 0

__

−=

σNδ

Nσ/

δ)(μXZ 0

__

++−=

σNδ

+≈σNδ

zβ α/2Φ

Y si definimos Y si definimos ββ = = ΦΦ(-z(-zββ), obtenemos), obtenemosδ

)σz(zN βα/2 +

≈


Error Tipo II y tamaño de la muestraError Tipo II y tamaño de la muestra


Para el ejemplo del combustible sólido. Si al analista le Para el ejemplo del combustible sólido. Si al analista le interesa diseñar la prueba de hipótesis de manera que si el interesa diseñar la prueba de hipótesis de manera que si el valor verdadero de valor verdadero de µµ es 51 cm/seg se rechace H es 51 cm/seg se rechace H00 con una con una

probabilidad alta (por ejemplo 90%) y con el mismo valor probabilidad alta (por ejemplo 90%) y con el mismo valor anterior de anterior de αα=0.05=0.05En este caso En este caso δδ=1, =1, σσ=2, =2, αα=0.05 por lo tanto, mediante =0.05 por lo tanto, mediante Matlab:Matlab:

N= 4*(norminv(0.025) + norminv(0.1))^2 N= 4*(norminv(0.025) + norminv(0.1))^2 ≈≈ 4242

ObservaciónObservación: Debe tenerse cuidado cuando se interpretan : Debe tenerse cuidado cuando se interpretan los resultados basados en una los resultados basados en una muestra muy grandemuestra muy grande, ya que , ya que es muy probable que se detecte cualquier alejamiento es muy probable que se detecte cualquier alejamiento (muy pequeño) respecto al valor hipotético (muy pequeño) respecto al valor hipotético µµoo . . Esta Esta

diferencia podría no tener ninguna importancia práctica diferencia podría no tener ninguna importancia práctica pero conducir al rechazo de Hpero conducir al rechazo de H00

Pruebas de HipótesisPruebas de HipótesisPrueba de hipótesis sobre la igualdad de dos Prueba de hipótesis sobre la igualdad de dos

medias (varianzas conocidas)medias (varianzas conocidas)


Se tienen Se tienen dos poblacionesdos poblaciones de interés. La primera con media de interés. La primera con media µµ11 y varianza y varianza σσ11

22 conocidas y la segunda con media conocidas y la segunda con media µµ22 y y

varianza varianza σσ2222 conocidas. Interesa saber si las dos medias conocidas. Interesa saber si las dos medias

son iguales. Se plantean las hipótesisson iguales. Se plantean las hipótesis HH00: : µµ11 = = µµ22

HH11: : µµ11 ≠≠ µµ22

Por lo tanto el siguiente estadístico de pruebaPor lo tanto el siguiente estadístico de prueba

Es N(0,1) si HEs N(0,1) si H00 es verdadera. es verdadera.

Por lo tanto Por lo tanto se rechazará Hse rechazará H00 si z si z00>z>zαα/2/2 o z<z o z<z--αα/2/2

SuposicionesSuposiciones: Las dos poblaciones son normales o se : Las dos poblaciones son normales o se cumplen las condiciones del teorema del límite central. cumplen las condiciones del teorema del límite central. EntoncesEntonces el estadístico X el estadístico X11-X-X22 es una variable Normal con es una variable Normal con

media media µµ1 1 - - µµ2 2 y varianza y varianza σσ1122 /N /N11+ + σσ22

2/2//N/N22

__ __

2

22

1

21

2

___

1

___

Nσ

Nσ

XXZ

+

−=




EjemploEjemplo: Un diseñador quiere reducir el tiempo de secado : Un diseñador quiere reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura. La de una pintura. Se prueban dos fórmulas de pintura. La fórmula 1 es la normal y la fórmula 2 posee un ingrediente fórmula 1 es la normal y la fórmula 2 posee un ingrediente secante que se espera reduzca el tiempo de secado. Se secante que se espera reduzca el tiempo de secado. Se sabe que el tiempo de secado tiene una desviación sabe que el tiempo de secado tiene una desviación estándar de 8 min y que ésta no se afecta con la adición del estándar de 8 min y que ésta no se afecta con la adición del nuevo ingrediente. Se pintan 10 especímenes con la nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos promedio de secado de xpromedio de secado de x11=121 min, y x=121 min, y x22=112 min. =112 min.

respectivamente. ¿A qué conclusión se llega sobre la respectivamente. ¿A qué conclusión se llega sobre la eficacia del nuevo ingrediente utilizando eficacia del nuevo ingrediente utilizando αα=0.05.?=0.05.?• Cantidad de interés: Cantidad de interés: µµ1 1 - - µµ22

• HH00: : µµ11 = = µµ22 • HH11: : µµ11 > > µµ22 (se busca evidencia fuerte que indique que el (se busca evidencia fuerte que indique que el

tiempo de secado promedio de la muestra 2 es menor)tiempo de secado promedio de la muestra 2 es menor)

_ _ __




∀ αα=0.05=0.05• El estadístico de prueba es El estadístico de prueba es

• HH00 se rechazará si z>z se rechazará si z>z0.050.05 = 1.645 = 1.645• Sustituyendo los datos, obtenemos z=(121-112)/Sustituyendo los datos, obtenemos z=(121-112)/

(12.8)(12.8)1/21/2=2.52=2.52• Conclusión: Puesto que z = 2.52 > 1.645 se rechaza HConclusión: Puesto que z = 2.52 > 1.645 se rechaza H00

con un nivel de significancia con un nivel de significancia αα=0.05 concluyéndose el =0.05 concluyéndose el nuevo ingrediente sí disminuye el tiempo de secado.nuevo ingrediente sí disminuye el tiempo de secado.

Alternativamente puede calcularse un valor P =1-Alternativamente puede calcularse un valor P =1-ΦΦ(2.52) = 0.0059, es decir, se rechazará H(2.52) = 0.0059, es decir, se rechazará H00 para para

cualquier nivel de significancia cualquier nivel de significancia α≥α≥0.00590.0059

2

22

1

21

2

___

1

___

Nσ

Nσ

/)XX(Z +−=

Pruebas de HipótesisPruebas de HipótesisIdentificación Causa - EfectoIdentificación Causa - Efecto


En el ejemplo anterior se supone que fueron asignados En el ejemplo anterior se supone que fueron asignados de de manera aleatoriamanera aleatoria 10 especímenes a una fórmula 10 especímenes a una fórmula ((tratamientotratamiento) y 10 especímenes a la otra luego se aplicó la ) y 10 especímenes a la otra luego se aplicó la pintura en un pintura en un orden aleatorioorden aleatorio a cada especímen hasta a cada especímen hasta pintar los 20. Este es un pintar los 20. Este es un Experimento Completamente Experimento Completamente AleatorizadoAleatorizado..

En un estudio estadístico sobre la incidencia del cáncer En un estudio estadístico sobre la incidencia del cáncer pulmonar entre personas que fuman normalmente se hace pulmonar entre personas que fuman normalmente se hace un seguimiento en el tiempo de los individuos a prueba. un seguimiento en el tiempo de los individuos a prueba. Este es un Este es un Experimento ObservacionalExperimento Observacional

En este caso no se puede asignar de manera aleatoria un En este caso no se puede asignar de manera aleatoria un tratamiento u otro (fumar o no fumar) a una porción de los tratamiento u otro (fumar o no fumar) a una porción de los individuos. Por otro lado, el hábito de fumar no es el único individuos. Por otro lado, el hábito de fumar no es el único factor que influye en el desarrollo de cáncer pulmonar.factor que influye en el desarrollo de cáncer pulmonar.

Pruebas de HipótesisPruebas de HipótesisPrueba de Hipótesis sobre la media, Prueba de Hipótesis sobre la media, varianza varianza

desconocidadesconocida


Si la población tiene una distribución Normal con media Si la población tiene una distribución Normal con media µµ y y varianza varianza σσ22 desconocidas pudiera utilizarse el estadístico S desconocidas pudiera utilizarse el estadístico S22 y el procedimiento descrito anteriormente para varianza y el procedimiento descrito anteriormente para varianza conocida (esto es válido para N grande), pero si la muestra conocida (esto es válido para N grande), pero si la muestra es pequeña, tendremos que usar el estadístico siguiente,es pequeña, tendremos que usar el estadístico siguiente,

el cual tiene una distribución t con N-1 grados de libertad,el cual tiene una distribución t con N-1 grados de libertad,

Así, para la prueba de Hipótesis bilateral Así, para la prueba de Hipótesis bilateral HH00: : µ µ = = µµ00

HH11: : µµ ≠≠ µµ00

Se rechazará HSe rechazará H00 si t>t si t>tαα/2,N-1/2,N-1 o si t<t o si t<t--αα/2,N-1/2,N-1

NS/

μXT 0

__

−=

Pruebas de HipótesisPruebas de HipótesisPrueba de Hipótesis sobre la media, Prueba de Hipótesis sobre la media, varianza varianza

desconocidadesconocida


EjercicioEjercicio: Los siguientes son datos de pruebas de : Los siguientes son datos de pruebas de resistencia a la adhesión, los siguientes datos presentan la resistencia a la adhesión, los siguientes datos presentan la carga (en Mpa) a la cual 22 especímenes fallaron carga (en Mpa) a la cual 22 especímenes fallaron

¿Sugieren los datos que la carga promedio de falla es ¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga de falla tiene mayor que 10Mpa? Supóngase que la carga de falla tiene una distribución Normal y utilice una distribución Normal y utilice αα=0.05. Desarrolle los 8 =0.05. Desarrolle los 8 pasos del procedimiento general y encuentre un valor P pasos del procedimiento general y encuentre un valor P para la prueba.para la prueba.

19.8 18.5 17.6 16.7 15.8 15.4

14.1 13.6 11.9 11.4 11.4 8.8

7.5 15.4 15.4 19.5 14.9 12.7

11.9 11.4 10.1 7.9


Valor P de una prueba tValor P de una prueba t


El valor P es el más pequeño nivel de significancia para el El valor P es el más pequeño nivel de significancia para el que Hque H00 debe rechazarse, esto es debe rechazarse, esto es el área de la colael área de la cola (de la (de la

curva de densidad de probabilidad) que está más allá del curva de densidad de probabilidad) que está más allá del valor del estadístico (en este caso t). o el doble de esta valor del estadístico (en este caso t). o el doble de esta área en pruebas bilaterales.área en pruebas bilaterales.

Selección del Tamaño de la MuestraSelección del Tamaño de la Muestra

En todas las pruebas de hipótesis estadísticas se puede En todas las pruebas de hipótesis estadísticas se puede calcular el tamaño de la muestra (N) adecuada en función calcular el tamaño de la muestra (N) adecuada en función de la magnitud del error de tipo I que se permite. En cada de la magnitud del error de tipo I que se permite. En cada tipo de prueba se encuentran fórmulas diferentes para N.tipo de prueba se encuentran fórmulas diferentes para N.


Otras pruebas de HipótesisOtras pruebas de Hipótesis


En forma similar a como se describió el caso de la media y En forma similar a como se describió el caso de la media y la diferencia de medias, se pueden realizar diferentes la diferencia de medias, se pueden realizar diferentes pruebas de hipótesis para estos mismos u otros pruebas de hipótesis para estos mismos u otros parámetros, lo único que cambia en cada caso es:parámetros, lo único que cambia en cada caso es:

- Las suposiciones sobre la distribución de la - Las suposiciones sobre la distribución de la poblaciónpoblación

- El estadístico elegido y por consiguiente- El estadístico elegido y por consiguiente- La distribución del estadístico.- La distribución del estadístico.

En la siguiente tabla se resumen algunas de las pruebas de En la siguiente tabla se resumen algunas de las pruebas de hipótesis más utilizadashipótesis más utilizadas

Pruebas de HipótesisPruebas de HipótesisOtras pruebas paramétricas de HipótesisOtras pruebas paramétricas de Hipótesis


Prueba sobrePrueba sobre Hipótesis NulaHipótesis Nula SuposicionesSuposiciones Estadístico Estadístico de Pruebade Prueba

La mediaLa mediaµ µ = = µµ00 σσ22 conocida conocida NormalNormal

µ µ = = µµ00 σσ22 desconocida desconocida TT

Igualdad de Igualdad de mediasmedias

µµ11 = = µµ22 σσ1122 = = σσ22

22 conocidas conocidas NormalNormal

µµ11 = = µµ22 σσ1122 = = σσ22

22 desconocidas desconocidas TT

µµ11 = = µµ22 σσ1122 ≠≠ σσ22

22 conocidas conocidas TT

La varianzaLa varianzaσσ22 = = σσ00

22 dist. Normal, N pequeñadist. Normal, N pequeña JiJi22

σσ22 = = σσ0022 N grandeN grande NormalNormal

Igualdad de dos Igualdad de dos varianzasvarianzas

σσ1122 = = σσ22

22 FF

Una proporciónUna proporción p = pp = p00 NormalNormal

Igualdad de dos Igualdad de dos proporcionesproporciones

pp11 = p = p22 NormalNormal


Pruebas de Hipótesis No ParamétricasPruebas de Hipótesis No Paramétricas


Las pruebas de hipótesis anteriores se llaman Las pruebas de hipótesis anteriores se llaman paramétricasparamétricas porque suponen conocida la distribución de la población y porque suponen conocida la distribución de la población y la hipótesis es acerca de los parámetros de dicha la hipótesis es acerca de los parámetros de dicha distribución. distribución.

Otra clase de hipótesis es: No se sabe cual es la Otra clase de hipótesis es: No se sabe cual es la distribución de la población y distribución de la población y se desea probar la hipótesis se desea probar la hipótesis de que cierta distribución en particular será un modelo de que cierta distribución en particular será un modelo satisfactoriosatisfactorio. Por ejemplo, tal vez se requiera probar si la . Por ejemplo, tal vez se requiera probar si la distribución es Normaldistribución es Normal


Prueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste


Se parte de una Se parte de una muestra aleatoriamuestra aleatoria de tamaño N, de tamaño N, proveniente de una población cuya distribución de proveniente de una población cuya distribución de probabilidad es desconocida.probabilidad es desconocida. Las N observaciones se acomodan en un Las N observaciones se acomodan en un HistogramaHistograma de de frecuencia con k intervalos de clase. Sea frecuencia con k intervalos de clase. Sea OOii la i-ésima la i-ésima

frecuencia de clasefrecuencia de clase De la distribución de probabilidad propuesta se calcula la De la distribución de probabilidad propuesta se calcula la frecuencia esperada Efrecuencia esperada Eii en el i-ésimo intervalo de clase en el i-ésimo intervalo de clase

El El estadístico de prueba estadístico de prueba eses

El cual tiene una El cual tiene una distribución Jidistribución Ji22 con k-p-1 grados de con k-p-1 grados de libertad libertad si la población sigue la distribución propuesta. si la población sigue la distribución propuesta. (donde p es el número de parámetros de la población)(donde p es el número de parámetros de la población)

∑=

−=k

1i i

2ii2

E)E(O

χ




La aproximación mejora a medida que N es más grandeLa aproximación mejora a medida que N es más grande

La hipótesis debe rechazarse si el valor del estadístico de La hipótesis debe rechazarse si el valor del estadístico de prueba esprueba es

χχ2 2 > > χχ221-1-αα,k-p-1,k-p-1

PrecauciónPrecaución: Si las frecuencias esperadas son muy : Si las frecuencias esperadas son muy pequeñas el estadístico pequeñas el estadístico χχ22 no reflejará el alejamiento entre no reflejará el alejamiento entre lo observado y lo esperado. (Se considera que valores lo observado y lo esperado. (Se considera que valores menores de 5 son pequeños)menores de 5 son pequeños) Si en una prueba resultan frecuencias esperadas Si en una prueba resultan frecuencias esperadas pequeñas, se pueden pequeñas, se pueden combinar intervalos de clase combinar intervalos de clase adyascentesadyascentes para aumentar estos valores, ya que no es para aumentar estos valores, ya que no es necesario que los anchos de clase sean del mismo tamañonecesario que los anchos de clase sean del mismo tamaño




Ejemplo 1Ejemplo 1.- Un algoritmo para generar enteros .- Un algoritmo para generar enteros pseudoealeatorios de 0 a 9 ´se prueba para determinar si pseudoealeatorios de 0 a 9 ´se prueba para determinar si tiene una distribución uniforme, para ello se generan 1000 tiene una distribución uniforme, para ello se generan 1000 números, obteniendo la siguiente tabla de frecuencia. números, obteniendo la siguiente tabla de frecuencia. ¿Existe evidencia de que el generador funciona de manera ¿Existe evidencia de que el generador funciona de manera correcta?. Utilice correcta?. Utilice αα=0.05=0.05

Como EComo Eii se puede calcular sin estimar ningún parámetro a se puede calcular sin estimar ningún parámetro a

partir de la muestra, entonces p=0 y el estadístico será jipartir de la muestra, entonces p=0 y el estadístico será ji22 con k-p-1=10-0-1=9 grados de libertad.con k-p-1=10-0-1=9 grados de libertad.

0 1 2 3 4 5 6 7 8 9

Oi 94 93 112 101 104 95 100 99 108 94

Ei 100 100 100 100 100 100 100 100 100 100




Variable de interés: distribución de los números Variable de interés: distribución de los números pseudoaleatoriospseudoaleatorios

HH00: La distribución es uniforme en el intervalo de 0 a 9: La distribución es uniforme en el intervalo de 0 a 9 H1: La distribución No es uniforme en ese intervaloH1: La distribución No es uniforme en ese intervalo αα = 0.05= 0.05 El estadístico de prueba es El estadístico de prueba es Se rechazará HSe rechazará H00 si si χχ22> > χχ22 0.05,90.05,9=16.92=16.92 CálculosCálculos

χχ22= 0.01*( (94-100)= 0.01*( (94-100)22+(93-100)+(93-100)22+...+(94-100)+...+(94-100)22 )=3.72 )=3.729)9) Conclusiones: como 3.72 < 16.92 No es posible Conclusiones: como 3.72 < 16.92 No es posible

rechazar la hipótesis. Por lo tanto parece ser que el rechazar la hipótesis. Por lo tanto parece ser que el generador de números aleatorios trabaja bien. generador de números aleatorios trabaja bien.

¿Cual es el valor P de la prueba ?¿Cual es el valor P de la prueba ?

∑=

−=k

1i i

2ii2

E

)E(Oχ




Ejemplo 2Ejemplo 2.- Se propone que el número de defectos en .- Se propone que el número de defectos en tarjetas de circuito impreso sigue una tarjetas de circuito impreso sigue una distribución de distribución de PoissonPoisson. Se obtiene una muestra de 60 tarjetas y se . Se obtiene una muestra de 60 tarjetas y se observa el número de defectos, con los siguientes observa el número de defectos, con los siguientes resultados:resultados:

defectosdefectos 00 11 22 33 4 o más4 o más

OOii 3232 1515 99 44 00

Distribución de PoissonDistribución de Poisson. Es una distribución discreta cuya . Es una distribución discreta cuya función de probabilidad es función de probabilidad es

Definida para x=0,1,2,3,...Definida para x=0,1,2,3,...∞∞. Donde . Donde µµ es la media de X es la media de X

x!μe

f(x)x-μ

=

Pruebas de HipótesisPruebas de HipótesisPrueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste


Cálculo de las frecuencias Esperadas ECálculo de las frecuencias Esperadas Eii::

Un estimador para la media Un estimador para la media µµ de la distribución de Poisson de la distribución de Poisson es la media muestral, es decir, es la media muestral, es decir, (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando este (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando este valor de m obtenemos la siguiente tabla de frecuencias valor de m obtenemos la siguiente tabla de frecuencias esperadas:esperadas:

xx 00 11 22 33 4 o más4 o másF(x)F(x) 0.4720.472 0.3540.354 0.1330.133 0.0330.033 0.00730.0073EEii 28.3228.32 21.2421.24 7.987.98 1.981.98 0.440.44

Para evitar que las últimas dos frecuencias esperadas sean Para evitar que las últimas dos frecuencias esperadas sean menores que 5 combinamos las últimas tres celdas para menores que 5 combinamos las últimas tres celdas para obtener:obtener:

xx 00 11 2 o más2 o másEEii 28.3228.32 21.2421.24 10.4410.44OOii 3232 1515 1313

Pruebas de HipótesisPruebas de HipótesisPrueba JiPrueba Ji22 de la Bondad del Ajuste de la Bondad del Ajuste


Variable de interés: La forma de distribución de los Variable de interés: La forma de distribución de los defectos en tarjetas de circuito impresodefectos en tarjetas de circuito impreso

HH00: La distribución es de Poisson : La distribución es de Poisson H1: La distribución No es PoissonH1: La distribución No es Poisson αα = 0.05= 0.05 El estadístico de prueba es , el cual El estadístico de prueba es , el cual

tiene una distribución tiene una distribución χχ22 con k-p-1=3-1-1=1 grado de con k-p-1=3-1-1=1 grado de libertadlibertad

Se rechazará HSe rechazará H00 si si χχ22> > χχ22 0.05,10.05,1=3.84=3.84 CálculosCálculos

χχ22= (94-100)= (94-100)22/28.32+(93-100)/28.32+(93-100)22/21.24+(94-100)/21.24+(94-100)22/10.44 = /10.44 = 2.942.94

9)9) Conclusiones: como 2.94 < 3.84. No es posible rechazar Conclusiones: como 2.94 < 3.84. No es posible rechazar la hipótesis. Por lo tanto parece ser que la distribución la hipótesis. Por lo tanto parece ser que la distribución de defectos en las placas de circuito impreso es Poissonde defectos en las placas de circuito impreso es Poisson

El valor P de la prueba es P=0.9861El valor P de la prueba es P=0.9861

∑=

−=k

1i i

2ii2

E

)E(Oχ




Ejemplo 3Ejemplo 3.- Se desea determinar con .- Se desea determinar con αα=0.05 si el voltaje de =0.05 si el voltaje de salida de una fuente de alimentación está descrito por una salida de una fuente de alimentación está descrito por una distribución Normal. Se toma una muestra aleatoria de distribución Normal. Se toma una muestra aleatoria de N=100 fuentes, determinándose los siguientes valores N=100 fuentes, determinándose los siguientes valores muestrales x = 5.04, s = 0.08.muestrales x = 5.04, s = 0.08.

Para evitar valores de frecuencias esperadas muy Para evitar valores de frecuencias esperadas muy pequeños, de antemano se elige el ancho de los intervalos pequeños, de antemano se elige el ancho de los intervalos de clase de manera que la de clase de manera que la frecuencia esperada sea frecuencia esperada sea constante constante FFi i = N / k= N / k..

Así, si k=8 clases, se buscarán 8 intervalos de clase que Así, si k=8 clases, se buscarán 8 intervalos de clase que dividan la curva de densidad normal en 8 áreas iguales, dividan la curva de densidad normal en 8 áreas iguales, como se muestra en la siguiente figura para media 0 y como se muestra en la siguiente figura para media 0 y varianza 1.varianza 1.




Para la distribución N(0,1) los límites de los 8 intervalos sonPara la distribución N(0,1) los límites de los 8 intervalos son – –∞∞, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+, -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+∞∞,,

por lo tanto para el ejemplo, los límites sonpor lo tanto para el ejemplo, los límites son – –∞∞, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+, 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+∞∞

Con esta elección se obtiene la siguiente tabla de Con esta elección se obtiene la siguiente tabla de frecuencias para la muestrafrecuencias para la muestra

-4 -3 -2 -1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4




Intervalo de ClaseIntervalo de Clase OOii EEii

De –De –∞∞ a 4.948a 4.948

De 4.948 a 4.986De 4.948 a 4.986

De 4.986 a 5.014De 4.986 a 5.014

De 5.014 a 5.040De 5.014 a 5.040

De 5.040 a 5.066De 5.040 a 5.066

De 5.066 a 5.094De 5.066 a 5.094

De 5.094 a 5.132De 5.094 a 5.132

De 5.132 a + De 5.132 a + ∞∞

1212

1414

1212

1313

1212

1111

1212

1414

12.512.5

12.512.5

12.512.5

12.512.5

12.512.5

12.512.5

12.512.5

12.512.5

Suma:Suma: 100100 100100




La variable de interés es el tipo de distribución del La variable de interés es el tipo de distribución del voltaje dado por una fuente de alimentaciónvoltaje dado por una fuente de alimentación

HH00: El tipo de distribución es Normal: El tipo de distribución es Normal HH11: El tipo de distribución no es Normal: El tipo de distribución no es Normal αα = 0.05= 0.05 El estadístico de prueba esEl estadístico de prueba es Para determinar los intervalos de clase se requirió Para determinar los intervalos de clase se requirió

estimar estimar µµ y y σσ, por lo tanto los grados de libertad son k-, por lo tanto los grados de libertad son k-p-1=8-2-1=5, por lo tanto se rechazará Hp-1=8-2-1=5, por lo tanto se rechazará H00 si si χχ2 2 > > χχ22

0.05,5 0.05,5 = =

11.0711.07 Cálculos:Cálculos:χχ2 2 = ( = ( 11//12.5 12.5 )[(12-12.5))[(12-12.5)22+(14-12.5)+(14-12.5)22+...+(14-12.5)+...+(14-12.5)22] = 0.64] = 0.64

9)9) Conclusiones: como 0.64<11.07, no es posible rechazar Conclusiones: como 0.64<11.07, no es posible rechazar H0, por lo tanto no hay evidencia fuerte de que la H0, por lo tanto no hay evidencia fuerte de que la distribución no sea Normal.distribución no sea Normal.El valor P de la prueba (para El valor P de la prueba (para χχ2 2 = 0.64) es P=0.9861.= 0.64) es P=0.9861.

∑=

−=k

1i i

2ii2

E

)E(Oχ


Gráfica de ProbabilidadGráfica de Probabilidad


La gráfica de probabilidad es un La gráfica de probabilidad es un método gráficométodo gráfico que que permite determinar si una muestra de datos se ajusta a una permite determinar si una muestra de datos se ajusta a una distribución propuesta en base a una análisis visual distribución propuesta en base a una análisis visual subjetivo.subjetivo.Originalmente esta gráfica se realizaba sobre un papel Originalmente esta gráfica se realizaba sobre un papel especial llamado especial llamado papel de probabilidadpapel de probabilidad diseñado con las diseñado con las escalas adecuadas para las diferentes distribuciones.escalas adecuadas para las diferentes distribuciones.

ProcedimientoProcedimiento:: Se ordena la muestra de menor a mayor: xSe ordena la muestra de menor a mayor: x11,x,x22,....,x,....,xNN Se grafica sobre el papel de probabilidad la frecuencia Se grafica sobre el papel de probabilidad la frecuencia

acumulada observada (i-0.5)/N contra el valor de los acumulada observada (i-0.5)/N contra el valor de los datos ordenadosdatos ordenados

Si los puntos obtenidos se devían sif¿gnificativamente Si los puntos obtenidos se devían sif¿gnificativamente de una línea recta, el modelo propuesto no será el de una línea recta, el modelo propuesto no será el apropiado.apropiado.




EjemploEjemplo: Las siguientes son diez observaciones sobre la : Las siguientes son diez observaciones sobre la duración en minutos de las baterías de computadoras duración en minutos de las baterías de computadoras portátiles: portátiles:

176, 183, 185, 190, 191, 192, 201, 205, 214, 220176, 183, 185, 190, 191, 192, 201, 205, 214, 220Utilizar la gráfica de probabilidad para determinar si la Utilizar la gráfica de probabilidad para determinar si la muestra corresponde a una distribución Normal.muestra corresponde a una distribución Normal.

i 1 2 3 4 5 6 7 8 9 10

xi 176 183 185 190 191 192 201 205 214 220

(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95

ProcedimientoProcedimiento: Formamos la tabla de los datos ordenados : Formamos la tabla de los datos ordenados y las frecuencias acumuladas (i-0.5)/N siguiente:y las frecuencias acumuladas (i-0.5)/N siguiente:




175 180 185 190 195 200 205 210 215 220

0.05 0.05

0.10 0.10

0.25 0.25

0.50 0.50

0.75 0.75

0.90 0.90

0.95 0.95

Datos (XDatos (X ii))

Fre

cue

nci

a a

cum

ula

da

(i-

0.5

)/N

Fre

cue

nci

a a

cum

ula

da

(i-

0.5

)/N

Gráfica de Probabilidad NormalGráfica de Probabilidad Normal

00.0.0

1.01.0

µ≈195

0.0.8484

σ≈16




ObservacionesObservaciones: : Al analizar la gráfica debe recordarse que el eje vertical Al analizar la gráfica debe recordarse que el eje vertical

está graduado en está graduado en percentilespercentiles, por ello la media se , por ello la media se encuentra en el percentil 50.encuentra en el percentil 50.

Los puntos más confiables son los que están entre el Los puntos más confiables son los que están entre el percentil 25 y el 75, de hecho, la linea trazada debe unir percentil 25 y el 75, de hecho, la linea trazada debe unir estos percentilesestos percentiles

Se puede obtener una Se puede obtener una gráfica sobre papel normalgráfica sobre papel normal ajustando la escala vertical de acuerdo a zajustando la escala vertical de acuerdo a zii, donde , donde ΦΦ(z(zii) )

= (i-0.5)/N, para el ejemplo:= (i-0.5)/N, para el ejemplo:i 1 2 3 4 5 6 7 8 9 10

(i-0.5)/10 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95

zi -1.64 -1.04 -0.67 -0.39 -0.13 0.13 0.39 0.67 1.04 1.64

4)4) En Matlab se puede usar la función En Matlab se puede usar la función normplotnormplot


Tablas de ContingenciaTablas de Contingencia


Una Una tabla de contingenciatabla de contingencia es una herramienta que nos es una herramienta que nos permite poner a prueba si permite poner a prueba si dos criterios de clasificación de dos criterios de clasificación de una misma muestrauna misma muestra son independientes o no, por ejemplo: son independientes o no, por ejemplo:

Población Criterio 1 Criterio 2

Ingenieros recién egresados Salario inicial Institución de origen

Estudiantes Nivel Socioeconómico Promedio académico

Número de fallas en un proceso

Maquinaria utilizada Turno

Estudiantes Calif. en Materia 1 Calif. en Materia 2

Fallas en un transformador Tipo de falla Ubicación

Etc...




ProcedimientoProcedimiento::Se forma una tabla de frecuencias observadas Oij, donde:Se forma una tabla de frecuencias observadas Oij, donde: i=No. de renglón= nivel de clasificación i del criterio 1 (i=1,2,,3,...,r)i=No. de renglón= nivel de clasificación i del criterio 1 (i=1,2,,3,...,r) j=No. de columna= nivel de clasificación j del Criterio 2 (j=1,2,3,...,c)j=No. de columna= nivel de clasificación j del Criterio 2 (j=1,2,3,...,c)

Criterio2

Criterio1Nivel 1 Nivel 2 ... Nivel c

Nivel 1 O11 O12 O1c

Nivel 2 O21 O22 O2c

... ...

Nivel r Or1 Or1 ... Orc




ConsideracionesConsideraciones: : Si los criterios son independientes (Hipótesis Si los criterios son independientes (Hipótesis Nula)Nula): La probabilidad de que un elemento elegido al azar caiga : La probabilidad de que un elemento elegido al azar caiga en la ij-ésima celda es en la ij-ésima celda es ppijij=u=uii v vjj,,donde donde uuii= probabilidad de que caiga en el renglón i= probabilidad de que caiga en el renglón i

uujj= probabilidad de que caiga en la columna j= probabilidad de que caiga en la columna j

Son estimadores para Son estimadores para uuii, , vvjj : :

Por lo tanto, la frecuencia esperada en cada celda es Por lo tanto, la frecuencia esperada en cada celda es EEij ij = Np= Npij ij = = NuNuiivvjj, es decir, es decir

∑=

=c

1jijN

1i Ou ∑

=

=r

1iijN

1j Ov

∑∑==

=r

1iij

c

1jijN

1ij OOE




Para N grande el siguiente estadísticoPara N grande el siguiente estadístico

Tiene una distribución JiTiene una distribución Ji22 con (r-1)(c-1) grados de libertad siempre con (r-1)(c-1) grados de libertad siempre que la Hipótesis nula sea verdadera.que la Hipótesis nula sea verdadera.

Por lo tanto, la Hipótesis de independencia se deberá rechazar si Por lo tanto, la Hipótesis de independencia se deberá rechazar si el estadístico el estadístico χχ22 > > χχ22

αα,(r-1)(c-1),(r-1)(c-1). .

∑∑==

−=

r

1i ij

2ijij

c

1j

2

E

)E(Oχ




EjemploEjemplo: Los empleados de una compañía eligen uno de tres : Los empleados de una compañía eligen uno de tres posibles planes de pensión. La gerencia desea saber con posibles planes de pensión. La gerencia desea saber con αα=0.05 si =0.05 si la preferencia en la elección es independiente de la clasificación la preferencia en la elección es independiente de la clasificación del contrato (asalariados y por horas). De una muestra aleatoria del contrato (asalariados y por horas). De una muestra aleatoria de 500 empleados se obtiene la siguiente tabla de contingenciade 500 empleados se obtiene la siguiente tabla de contingencia

Tipo de contratoTipo de contrato Plan 1Plan 1 Plan 2Plan 2 Plan 3Plan 3 TotalTotal

AsalariadosAsalariados 160160 140140 4040 340340

Por HorasPor Horas 4040 6060 6060 160160

TotalTotal 200200 200200 100100 500500




SoluciónSolución: Necesitaremos las frecuencias esperadas, para ello : Necesitaremos las frecuencias esperadas, para ello calculamos estimados de ucalculamos estimados de uii, v, vjj para i=1,2, j=1,2,3: para i=1,2, j=1,2,3:

uu11=0.68,=0.68, uu22=0.32,=0.32,vv11=0.4,=0.4, vv22=0.4,=0.4, vv33=0.2=0.2

Tipo de contratoTipo de contrato Plan 1Plan 1 Plan 2Plan 2 Plan 3Plan 3 TotalTotal

AsalariadosAsalariados 136136 136136 6868 340340

Por HorasPor Horas 6464 6464 3232 160160

TotalTotal 200200 200200 100100 500500

Con esto calculamos las frecuencias esperadas, por ejemploCon esto calculamos las frecuencias esperadas, por ejemploEE1111= Nu= Nu11vv11=500(0.68)(0.4)=136=500(0.68)(0.4)=136

El resto se muestran en la siguiente tablaEl resto se muestran en la siguiente tabla




La variable de interés es la preferencia de los empleados por La variable de interés es la preferencia de los empleados por los planes de pensiónlos planes de pensión

HH00: La preferencia es independiente del tipo de contrato: La preferencia es independiente del tipo de contrato HH11: La preferencia no es independiente del tipo de contrato: La preferencia no es independiente del tipo de contrato αα=0.05=0.05 El estadístico de prueba esEl estadístico de prueba es Como r=2, c=1, Como r=2, c=1, χχ22 tiene 2 grados de libertad, por lo tanto H0 tiene 2 grados de libertad, por lo tanto H0

debe rechazarse si debe rechazarse si χχ22> > χχ220.05,20.05,2=5.99=5.99

Cálculos: Cálculos: χχ2 2 = 49.63= 49.63 Como 49.63>5.99, Se rechaza la hipótesis de independencia. Como 49.63>5.99, Se rechaza la hipótesis de independencia.

El valor P para El valor P para χχ2 2 = 49.63 es P=1.671x= 49.63 es P=1.671x10-1110-11

∑∑==

−=

r

1i ij

2ijij

c

1j

2

E

)E(Oχ

diseño de invstigacion

Technology