investigación

10
«Dadme el número suficiente de pacientes y demostraré como estadísticamente significativa cualquier diferencia por pequeña que sea». Esta paráfrasis de Arquímedes, cuando se refería al uso de la palanca para levantar un mundo, ilus- tra la situación con la que algunos investigadores se han te- nido que enfrentar en la última década. En efecto, el benefi- cio terapéutico obtenido con algunos nuevos fármacos es a veces tan pequeño que para establecerlo con la suficiente seguridad se ha precisado un elevado número de pacientes. El estudio GUSTO (Global Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded Coronary Ar- teries) sobre la eficacia de la fibrinólisis en el infarto de miocardio 1 constituye un ejemplo reciente en el que fueron precisos más de 20.000 sujetos para demostrar como esta- dísticamente significativa una diferencia de mortalidad de poco menos de una unidad porcentual entre dos tratamien- tos trombolíticos (el 7,2% con estreptocinasa y el 6,3% con la administración rápida del activador del plasminógeno ti- sular). La situación opuesta, aquella en la que las diferen- cias clínica o biológicamente relevantes no se detectan como estadísticamente significativas como consecuencia de trabajar con tamaños muestrales insuficientes es, sin em- bargo, más frecuente 2,3 . Otros trabajos han abordado algunos aspectos parciales del cálculo del tamaño de la muestra con anterioridad 4-6 . El objeti- vo del presente artículo es revisar los conceptos y la metodolo- gía empleada para este cálculo en un número mayor de prue- bas estadísticas aplicadas en los diseños más frecuentemente utilizados en la investigación clínica y epidemiológica. Se per- sigue ofrecer al lector una orientación práctica en un punto crucial de la elaboración de un proyecto de investigación. Con este propósito, el artículo incluye algoritmos para con- trastes de hipótesis particulares como, por ejemplo, la com- paración de proporciones inferiores al 5% o de curvas de supervivencia. ¿Por qué estimar el tamaño de la muestra? El principio ge- neral que justifica trabajar con muestras es que resulta más barato, más rápido, más fácil y es más exacto (en el sentido de que es posible realizar medidas más precisas y exhausti- vas) que hacerlo con poblaciones completas 7 . A partir de los datos observados en la muestra, se realizarán pruebas estadísticas que permitan generalizar los resultados a la población de la que proceden, con una mínima proba- bilidad de error (en general ² 5%). Las estimaciones del nú- mero mínimo de sujetos necesario para ello se deben basar en la prueba estadística que se prevea utilizar. Por otro lado, el diseño de un proyecto de investigación debe incluir la estimación del tamaño de la muestra a utili- zar. De este modo, el investigador se ve obligado a precisar la magnitud y la dirección de sus hipótesis principales de trabajo. La estimación del tamaño muestral puede conside- rarse, por lo tanto, un instrumento del que dispone el inves- tigador para evaluar la factibilidad y la necesidad de recur- sos de su proyecto. En el cálculo del tamaño muestral, la utilización de hipótesis verosímiles deberá prevalecer sobre otros intereses de los investigadores como las posibilidades económicas, la disponibilidad de pacientes u otros. Cabe recordar que no es ético realizar un estudio con un ta- maño de muestra que no ofrezca un poder estadístico sufi- ciente, ya que, desde el punto de vista de la metodología científica, el diseño no es adecuado. ¿Qué información se necesita para la estimación del tamaño de la muestra? El resultado de calcular el tamaño de la muestra es una estimación, ya que es imposible predecir los hallazgos reales del estudio que se diseña. Se parte, por lo tanto, de datos hipotéticos basados, en el mejor de los ca- sos, en experiencias del pasado. Como toda estimación, está sujeta a error –en realidad a errores, ya que se precisan va- rios elementos para realizar los cálculos–, cuya magnitud de- penderá de la validez de los datos de referencia utilizados. A pesar de que existe un buen número de diseños de inves- tigación clínica y epidemiológica, la estimación del tamaño de la muestra requiere un número de ecuaciones pequeño (véase el apéndice) que se adaptan a cada circunstancia. Los factores que condicionan el número de individuos que pueden participar en un estudio pueden ser cuestiones de orden logístico –como las limitaciones financieras, el núme- ro de pacientes disponibles en el caso de enfermedades in- frecuentes y las propias necesidades de tiempo del estudio– en las que no entraremos. En segundo lugar, existen facto- res de orden estadístico (tabla 1) que condicionan el cálculo del tamaño de la muestra: 1. El error a, o riesgo de primera especie, constituye la pro- babilidad de rechazar en una prueba estadística la hipótesis nula cuando la alternativa es, en realidad, falsa: 1-a es el nivel de confianza de esta prueba. El criterio más corriente es aceptar un riesgo a ² 0,05. 2. El error b, o riesgo de segunda especie, representa la probabilidad de error al rechazar la hipótesis alternativa cuando, en realidad, es cierta. El criterio más corriente es aceptar un riesgo b entre 0,10 y 0,20. ESTADÍSTICA EN MEDICINA 267 Estimación del tamaño de la muestra en la investigación clínica y epidemiológica Jaume Marrugat, Joan Vila, Marco Pavesi y Ferran Sanz Unidad de Lípidos y Epidemiología Cardiovascular. Unidad de Informática Médica. Instituto Municipal de Investigación Médica (IMIM). Barcelona. Correspondencia: Dr. J. Marrugat. Unidad de Lípidos y Epidemiología Cardiovascular. Instituto Municipal de Investigación Médica (IMIM). Doctor Aiguader, 80. 08003 Barcelona. Manuscrito aceptado el 1-4-1997 Med Clin (Barc) 1998; 111: 267-276 TABLA 1 Tipos de error posibles al tomar una decisión en los contrastes de hipótesis Decisión Realidad H 0 H 1 H 1 a 1 – b H 0 1 – a b Hipótesis alternativa (H 1 ): existe un efecto de la intervención o exposición. Hipótesis nula (H 0 ): no existe tal diferencia. El error a (error de tipo I o riesgo de primera especie) consti- tuye la probabilidad de rechazar en una prueba estadística la hipótesis nula cuando es, en realidad, cierta: (1 – a) es el nivel de confianza de esta prueba. El error b (error de tipo II o riesgo de segunda especie) representa la probabilidad de error al rechazar la hipótesis alternativa cuando, en realidad, es cierta: (1 – b) es el poder estadístico de la prueba. bioestadística, epidemiología, investigación biomédica, tamaño muestral

Upload: yajaira-ugenio

Post on 30-Sep-2015

4 views

Category:

Documents


2 download

DESCRIPTION

Estimación del tamaño de la muestra en la investigación clínicay epidemiológica

TRANSCRIPT

  • a la poblacin de la que proceden, con una mnima proba-

    ESTADSTICA EN MEDICINA

    Estimacin del tamao de la muestra en la investigacin clnica y epidemiolgica

    tica Mdica.

    -

    I

    lbilidad de error (en general 5%). Las estimaciones del n-mero mnimo de sujetos necesario para ello se deben basaren la prueba estadstica que se prevea utilizar.Por otro lado, el diseo de un proyecto de investigacindebe incluir la estimacin del tamao de la muestra a utili-zar. De este modo, el investigador se ve obligado a precisar

    Correspondencia: Dr. J. Marrugat.Unidad de Lpidos y Epidemiologa Cardiovascular. Instituto Municipal de Investigacin Mdica (IMIM).Doctor Aiguader, 80. 08003 Barcelona.

    Manuscrito aceptado el 1-4-1997

    TABLA 1

    Tipos de error posibles al tomar una decisin en los contrastes de hiptesis

    DecisinRealidad

    H0 H1

    H1 a 1 bH0 1 a b

    Hiptesis alternativa (H1): existe un efecto de la intervencin o exposicin. Hiptesis nula(H0): no existe tal diferencia. El error a (error de tipo I o riesgo de primera especie) constituye la probabilidad de rechazar en una prueba estadstica la hiptesis nula cuando es, enrealidad, cierta: (1 a) es el nivel de confianza de esta prueba. El error b (error de tipo IDadme el nmero suficiente de pacientes y demostrarcomo estadsticamente significativa cualquier diferencia porpequea que sea. Esta parfrasis de Arqumedes, cuandose refera al uso de la palanca para levantar un mundo, ilus-tra la situacin con la que algunos investigadores se han te-nido que enfrentar en la ltima dcada. En efecto, el benefi-cio teraputico obtenido con algunos nuevos frmacos es aveces tan pequeo que para establecerlo con la suficienteseguridad se ha precisado un elevado nmero de pacientes.El estudio GUSTO (Global Utilization of Streptokinase andTissue Plasminogen Activator for Occluded Coronary Ar-teries) sobre la eficacia de la fibrinlisis en el infarto de miocardio1 constituye un ejemplo reciente en el que fueronprecisos ms de 20.000 sujetos para demostrar como esta-dsticamente significativa una diferencia de mortalidad depoco menos de una unidad porcentual entre dos tratamien-tos trombolticos (el 7,2% con estreptocinasa y el 6,3% conla administracin rpida del activador del plasmingeno ti-sular). La situacin opuesta, aquella en la que las diferen-cias clnica o biolgicamente relevantes no se detectancomo estadsticamente significativas como consecuencia detrabajar con tamaos muestrales insuficientes es, sin em-bargo, ms frecuente2,3.Otros trabajos han abordado algunos aspectos parciales delclculo del tamao de la muestra con anterioridad4-6. El objeti-vo del presente artculo es revisar los conceptos y la metodolo-ga empleada para este clculo en un nmero mayor de prue-bas estadsticas aplicadas en los diseos ms frecuentementeutilizados en la investigacin clnica y epidemiolgica. Se per-sigue ofrecer al lector una orientacin prctica en un puntocrucial de la elaboracin de un proyecto de investigacin. Con este propsito, el artculo incluye algoritmos para con-trastes de hiptesis particulares como, por ejemplo, la com-paracin de proporciones inferiores al 5% o de curvas desupervivencia.Por qu estimar el tamao de la muestra? El principio ge-neral que justifica trabajar con muestras es que resulta msbarato, ms rpido, ms fcil y es ms exacto (en el sentidode que es posible realizar medidas ms precisas y exhausti-vas) que hacerlo con poblaciones completas7.A partir de los datos observados en la muestra, se realizarnpruebas estadsticas que permitan generalizar los resultados

    Jaume Marrugat, Joan Vila, Marco Pavesi y Ferran Sanz

    Unidad de Lpidos y Epidemiologa Cardiovascular. Unidad de InformInstituto Municipal de Investigacin Mdica (IMIM). Barcelona.

    bioestadstica, epidemiologa, investigacin biomdica, tamao muestraMed Clin (Barc) 1998; 111: 267-276la magnitud y la direccin de sus hiptesis principales detrabajo. La estimacin del tamao muestral puede conside-rarse, por lo tanto, un instrumento del que dispone el inves-tigador para evaluar la factibilidad y la necesidad de recur-sos de su proyecto. En el clculo del tamao muestral, lautilizacin de hiptesis verosmiles deber prevalecer sobreotros intereses de los investigadores como las posibilidadeseconmicas, la disponibilidad de pacientes u otros. Cabe recordar que no es tico realizar un estudio con un ta-mao de muestra que no ofrezca un poder estadstico sufi-ciente, ya que, desde el punto de vista de la metodologacientfica, el diseo no es adecuado.Qu informacin se necesita para la estimacin del tamaode la muestra? El resultado de calcular el tamao de lamuestra es una estimacin, ya que es imposible predecir loshallazgos reales del estudio que se disea. Se parte, por lotanto, de datos hipotticos basados, en el mejor de los ca-sos, en experiencias del pasado. Como toda estimacin, estsujeta a error en realidad a errores, ya que se precisan va-rios elementos para realizar los clculos, cuya magnitud de-pender de la validez de los datos de referencia utilizados. A pesar de que existe un buen nmero de diseos de inves-tigacin clnica y epidemiolgica, la estimacin del tamaode la muestra requiere un nmero de ecuaciones pequeo(vase el apndice) que se adaptan a cada circunstancia. Los factores que condicionan el nmero de individuos quepueden participar en un estudio pueden ser cuestiones deorden logstico como las limitaciones financieras, el nme-ro de pacientes disponibles en el caso de enfermedades in-frecuentes y las propias necesidades de tiempo del estudioen las que no entraremos. En segundo lugar, existen facto-res de orden estadstico (tabla 1) que condicionan el clculodel tamao de la muestra:

    1. El error a, o riesgo de primera especie, constituye la pro-babilidad de rechazar en una prueba estadstica la hiptesisnula cuando la alternativa es, en realidad, falsa: 1-a es elnivel de confianza de esta prueba. El criterio ms corrientees aceptar un riesgo a 0,05.2. El error b, o riesgo de segunda especie, representa laprobabilidad de error al rechazar la hiptesis alternativacuando, en realidad, es cierta. El criterio ms corriente esaceptar un riesgo b entre 0,10 y 0,20.267

    o riesgo de segunda especie) representa la probabilidad de error al rechazar la hiptesisalternativa cuando, en realidad, es cierta: (1 b) es el poder estadstico de la prueba.

  • 263. El poder estadstico (1 - b) de la prueba se define comola probabilidad de rechazar la hiptesis nula cuando es cier-ta la alternativa. En trminos generales, se debera escoger un riesgo a igualal riesgo b si los tratamientos de ambos grupos son nuevos,de coste similar y hay buenas razones para considerar quelos dos son relativamente seguros. Es posible escoger unriesgo a mayor que el riesgo b cuando no existe un trata-miento establecido y el que se desea probar es relativamen-te barato, fcil de aplicar y no tiene serios efectos secunda-rios conocidos. Finalmente, la situacin ms habitual esaquella en que se dispone de un tratamiento ya establecido,seguro y eficaz con el que se desea comparar un tratamien-to nuevo: en este caso, el riesgo a debera ser inferior alriesgo b, ya que se considera que las eventuales conse-cuencias de un error de tipo II seran menos importantesque las de un error de tipo I4,7.4. La variabilidad de la medida. Cuanto ms se agrupen losvalores individuales de la variable estudiada alrededor deuno central, se requerirn menos individuos. En el caso delas variables continuas, la de mayor coeficiente de variacin(CV = DE/X, donde DE es la desviacin estndar, y X es la

    MEDICINA CLNICA. VOL. 111. NM. 7. 1998

    H1 H0

    Me Mc

    a/2 a/2

    X X

    H1

    Me

    Fig. 1. Distribucin de los valores de una variable continua segn la hiptesisnula y alternativa en un contraste bilateral. H1: hiptesis alternativa (existe unefecto de la intervencin o exposicin); H0: hiptesis nula (no existe un efectode la intervencin o exposicin); a: riesgo de primera especie; constituye laprobabilidad de rechazar en una prueba estadstica la hiptesis nula cuandola alternativa es, en realidad, falsa; b: riesgo de segunda especie; representala probabilidad de error al rechazar la hiptesis alternativa cuando, en reali-dad, es cierta; Me: media en el grupo expuesto o intervenido; Mc: media en elgrupo control (no expuesto o no intervenido); X: punto de decisin para el re-chazo/aceptacin de la H1, correspondiente al valor de la distribucin normalasociado a un riesgo a/2.media) requerir la muestra ms grande. En el caso de lascategricas debe utilizarse la estimacin de la proporcinque se acerque ms al 50%. En caso de existir hiptesiscon ambos tipos de variables se utilizar la categrica parael clculo del tamao de la muestra, puesto que general-mente obligar a reclutar un mayor nmero de sujetos.5. El tipo de contraste de hiptesis (unilateral o bilateral)que se desea realizar (fig. 1): cabe recordar que el punto Zde la distribucin normal correspondiente al riesgo a acep-tado (Za) cambia segn el tipo de contraste, siendo Za/2 enel bilateral y Za en el unilateral. Es recomendable utilizarsiempre el contraste bilateral ya que ofrece la estimacinms conservadora. El contraste unilateral debera reservarseexclusivamente para aquellas circunstancias en que una dife-rencia en un sentido llevara a la misma accin que la inexis-tencia de diferencias8,9. El valor correspondiente al riesgo baceptado en ambos tipos de contraste es Zb (unilateral).6. El incumplimiento de las intervenciones, las retiradas delestudio, las prdidas de seguimiento y los drop-in (adminis-tracin de un tratamiento en estudio diferente al asignadopor aleatorizacin o de un tratamiento prohibido en el ensa-yo) han de preverse en el clculo. De hecho, el tamao dela muestra estimado se refiere a los pacientes disponiblespara el anlisis al final del estudio y no a los inicialmente in-

    8cluidos. En las enfermedades graves, un incremento de lamuestra entre un 10 y un 20% suele ser suficiente paracompensar las prdidas de seguimiento debido a la alta de-pendencia que presenta el enfermo del sistema sanitario.Sin embargo, en patologas ms banales el nmero de pr-didas puede superar el 50%7,10,11.7. La distribucin de referencia. La hiptesis de trabajo secentra principalmente en una variable de inters que puedeser categrica o continua. El teorema del lmite central nosdice que la distribucin de las proporciones o de las mediasde todas las muestras posibles que se pueden obtener conesta variable sigue una distribucin aproximadamente nor-mal cuando las muestras son de tamao grande, en generaln > 30 para variables continuas y tanto (n*p) como (n*[1 p]) > 5 en variables categricas. Cuando estas condicionesno se cumplen deberan contemplarse otras distribucionescomo la binomial exacta, la de Poisson, la de Student, etc.8. La magnitud de la diferencia del efecto a detectar entrelos grupos en el acontecimiento de inters. La variable quemida dicho acontecimiento puede ser categrica (presenciao ausencia de curacin, por ejemplo) o continua (como lasconcentraciones plasmticas de colesterol total). Cuandoexista ms de una, deber considerarse aquella que requie-ra el mayor nmero de individuos. La magnitud de la dife-rencia del efecto a detectar como estadsticamente signifi-cativa ser el condicionante ms importante de los clculos,ya que el resto de valores puede fluctuar relativamente poco(como la Za, la Z y el tipo de contraste) o no depende delinvestigador (variabilidad). El criterio para establecer lamagnitud de esta diferencia es enteramente clnico o epide-miolgico. Por ejemplo, es a todas luces claro que una re-duccin en la mortalidad de 5 unidades porcentuales (su-pongamos del 20% en el grupo control al 15% con untratamiento nuevo) representa una mejora importante desdeel punto de vista clnico. Para detectar esta diferencia comoestadsticamente significativa se requeriran unos 1.100 su-jetos en cada grupo en condiciones de clculo estndar (a= 0,05, b = 0,20 en un contraste bilateral). Sin embargo, noest tan claro que la reduccin de una unidad porcentualen la mortalidad represente un beneficio teraputico rele-vante. En el supuesto de que dicha unidad porcentual re-presentara la diferencia entre el 20 y el 19% seran necesa-rios unos 26.000 sujetos en cada grupo. De estos ejemplosse comprende la afirmacin con que empezbamos este ar-tculo, segn la cual cualquier diferencia puede detectarsecomo estadsticamente significativa si el nmero de sujetoses suficientemente elevado12,13. Tan slo la capacidad de re-clutamiento (generalmente ampliable mediante estudiosmulticntricos de gran envergadura) pone lmite a este he-cho. Hay que aadir que las estimaciones del tamao de lamuestra se refieren a cada grupo de estudio (control e inter-vencin o expuesto). En el caso de anlisis estratificados, eltamao estimado se refiere siempre al estrato ms pequeoconsiderado. A veces, sin embargo, se pondera uno de losgrupos (generalmente, el control o no expuesto a un factor ointervencin) con el fin de precisar menos sujetos expuestosa la intervencin o que presenten el acontecimiento de inte-rs, dependiendo del tipo de diseo. Para ello se utiliza unfactor de ponderacin l (vase apndice).

    Tamao fijo o tamao variable

    Las muestras de tamao fijo se refieren a la situacin mscomn en la investigacin clinicoepidemiolgica, en la que

    se requiere la estimacin del tamao muestral previa a laejecucin del estudio. En otras situaciones, el tamao de lamuestra se ir incrementando hasta obtener un resultado

  • Apredeterminado (diseo secuencial), o se realizar un dise-o experimental de un solo caso. Estas dos ltimas se deno-minan muestras de tamao variable.A continuacin, se revisan las ecuaciones utilizadas paracada tipo de variable (continua o categrica) en los diseosde investigacin ms comunes, y se discuten las limitacio-nes de cada una de ellas y las alternativas ms adecuadasen cada caso. Se insiste en las muestras de tamao fijo y alfinal se presentan brevemente los diseos alternativos conmuestras de tamao variable.

    Muestras de tamao fijo

    Estimacin de parmetros poblacionales. Concierne esen-cialmente a los estudios transversales en los que, a partir deuna muestra, se pretende estimar el valor poblacional deuna variable continua (medias) o categrica (proporciones).Se trata de establecer a priori la precisin (amplitud del in-tervalo de confianza [IC]) deseada para dicha estimacin.Es necesario disponer de una estimacin, aunque sea im-precisa, del valor que se espera hallar en las proporciones yde la variancia en el caso de las medias. Esta estimacinpuede obtenerse de referencias bibliogrficas o realizandoun estudio piloto. En el caso particular de las proporciones,si no se dispone de una estimacin previa, el investigadorpuede tener presente que la proporcin de 0,5 (50%) es elvalor que requiere mayor tamao muestral.

    1. Proporciones. Se utiliza la frmula correspondiente a laaproximacin a la curva normal para el clculo del IC y sedespeja n (vase la frmula 1 del apndice).2. Medias. Se utiliza la frmula del clculo del IC para me-dias que corresponde a la aproximacin normal (vase lafrmula 2 del apndice).Las frmulas ms sencillas suponen que las poblacionesson infinitas. Si, por el contrario, el tamao poblacional es li-mitado (menor de un milln de elementos, por convencin)puede introducirse la correccin por finitud de la muestra(vase la frmula 3 del apndice).

    Comparacin de medias. Ntese, ante todo, que lo que in-fluye en la estimacin no son los valores de las medias decada grupo, sino su diferencia. Distinguimos varias situacio-nes correspondientes a diseos distintos:

    1. Comparacin con una media poblacional de referencia. Elinvestigador desea saber si la media observada en una mues-tra difiere de una media poblacional conocida. El algoritmopara el clculo se encuentra en la frmula 4 del apndice7.2. Comparacin de dos medias apareadas (medidas repeti-das) en un solo grupo. Interesa comparar el cambio medioentre una medida basal y otra posterior, contrastando la H0de que la medida de este cambio es igual a cero en la po-blacin. Corresponde al diseo cruzado.3. Comparacin de dos medias apareadas (medidas repeti-das) en 2 grupos. El cambio entre una medida basal y otraposterior se compara entre 2 grupos distintos de sujetos.Dado que puede existir un grado sustancial de correlacinentre la magnitud de la medida basal y la posterior, es ne-cesario corregir la frmula por el coeficiente de correlacin,que deber estimarse, al igual que la DE, a partir de expe-riencias previas (frmula 5 del apndice)14.4. Comparacin de dos medias independientes. Para lacomparacin de dos medias en muestras independientes seasume que la variancia es la misma en ambas poblaciones

    J. MARRUGAT ET AL. ESTIMACIN DEL Ty sta es la que se utiliza para la estimacin. Los clculos sebasan en la distribucin normal (vase la frmula 6 delapndice)7. Como puede verse en el apndice, la frmula 5es semejante a la anterior y puede deducirse fcilmente delrazonamiento realizado sobre la figura 1.5. Anlisis de la variancia. A pesar de que se pueden utilizartablas que simplifican la tarea15, se han propuesto mtodos declculo especficos16 basados en la distribucin F de Snede-cor. Sin embargo, una aproximacin ms sencilla que propo-nemos consiste en utilizar el clculo para la comparacin delas medias de 2 grupos corrigiendo el riesgo a para el nmerode pares de comparaciones posibles y tomando el resultadoobtenido como el tamao de cada grupo del estudio. La dife-rencia a detectar como estadsticamente significativa ser lamnima que se considere clnica o epidemiolgicamente rele-vante entre al menos un par de grupos estudiados. Este clcu-lo proporciona resultados muy parecidos a los obtenidos en ta-blas especficas y mediante algoritmos mucho ms complejos.

    Comparacin de proporciones. Se pueden emplear diferen-tes aproximaciones en el caso de tratarse de datos aparea-dos, en la comparacin de una proporcin observada conuna poblacional de referencia, en el de un diseo cruzadocon medidas repetidas o en el de muestras independientes.En todas estas situaciones se precisa una estimacin previade las proporciones que se espera hallar en ambos grupos. Dado que el error estndar (EE) de una proporcin P se cal-cula del siguiente modo:

    EE (P) = donde P es la proporcin poblacional que se sustituir por laproporcin observada en la muestra (la mejor estimacin) y nse refiere al tamao de muestra, el valor de la proporcin quemaximiza el EE es 0,5 (50%). Por lo tanto, a igualdad de dife-rencias a detectar, mayor ser la muestra requerida cuantoms se acerquen las proporciones a dicho valor. Adems, enlos contrastes unilaterales la direccin de la comparacintambin influir: es distinto alejarse que acercarse al 50%,siendo mayor el nmero de sujetos en el ltimo caso.

    1. Comparacin de una proporcin observada con una pro-porcin poblacional de referencia. Se utiliza la frmula ba-sada en la aproximacin normal a la distribucin binomial(vase la frmula 7 del apndice).2. Comparacin de dos proporciones independientes. Sepueden utilizar varias aproximaciones:

    Aproximacin normal a la distribucin binomial. Se puedeutilizar este mtodo cuando las proporciones se encuentranentre el 20 y el 80% y tanto (n p) como [n ( 1 n)] sonsuperiores a 5, ya que la distribucin de las muestras tiendea la normal (vase la frmula 8 del apndice)7. Aproximacin del arco-seno. Proporciona estimacionesprecisas basadas en el clculo de la probabilidad exacta deFisher en proporciones pequeas (de forma aproximada,por debajo del 20% o por encima del 80%). En stas, elmuestreo no sigue una distribucin normal y la DE dependede la proporcin17. Mediante dicha transformacin se elu-den estos inconvenientes (vase la frmula 9 del apndice). Aproximacin de Poisson. En proporciones por debajo del5% o por encima del 95% se prefiere la utilizacin de la dis-tribucin de Poisson. Se basa en el proceso de Poisson parafenmenos de baja frecuencia (vase la frmula 10 delapndice)7. Hiptesis de bioequivalencia entre dos proporciones. Co-rresponde al caso particular en el que interesa demostrarque la eficacia de una intervencin nueva no difiere de la de

    P (1 P)n

    MAO DE LA MUESTRA EN LA INVESTIGACIN CLNICA Y EPIDEMIOLGICAotra ya existente por ejemplo, por qu la disponible es mscara o produce ms efectos secundarios. Se trata de esta-blecer cul sera la diferencia que, desde el punto de vista

    269

  • 27clnico o epidemiolgico, resultara relevante, y realizar laestimacin con dicha diferencia. Otros autores menos con-servadores han propuesto mtodos de estimacin alternati-vos para este tipo de hiptesis que requieren menos sujetospor grupo10,18 (vase en el apndice la frmula 11).

    3. Proporciones apareadas (repetidas en un grupo). Corres-ponde a las investigaciones que observan la proporcin dela presencia de un acontecimiento antes y despus de unaintervencin o exposicin en un mismo grupo de individuos.Los clculos se basan en la prueba de McNemar (vase lafrmula 12 del apndice).

    Contrastes de hiptesis con odds ratio (OR). Una odds noes otra cosa que la razn entre la probabilidad p de unacontecimiento y la probabilidad contraria (1 p): por con-siguiente, la razn de odds indica cuntas veces resultams probable el acontecimiento en un grupo de expuestosa un factor con respecto a otro grupo de no expuestos. Setrata de una medida de riesgo empleada en los diseos decasos y controles o transversales. Estos tipos de diseo requieren que el investigador decida apriori la OR que se desea detectar como estadsticamentesignificativa, y proporcione una estimacin de la proporcinde expuestos en el grupo control. La estimacin en el grupode sujetos con el acontecimiento de inters entre los casosse realiza a partir de este dato y de la propia OR (vase lafrmula 13 del apndice). La estimacin se basa en la aproximacin normal a la distri-bucin binomial propuesta por Fleiss19 para contrastes bila-terales, totalmente equivalente a la comparacin de propor-ciones descrita anteriormente mediante la aproximacinnormal. Otros autores han propuesto aproximaciones alter-nativas que proporcionan estimaciones del mismo orden11.

    Contrastes de hiptesis con riesgos relativos (RR). El RR esel cociente entre la proporcin de acontecimientos en losexpuestos al factor (o intervencin) bajo estudio y la propor-cin en los no expuestos. Se trata de la medida de riesgoempleada en los diseos longitudinales de cohortes y en al-gunos ensayos clnicos. El clculo del tamao muestral para estos tipos de diseo re-quiere una estimacin del RR mnimo que se desea detectarcomo estadsticamente significativo y de la proporcin de su-jetos que presentan el acontecimiento de inters en el grupocontrol no expuesto al factor o intervencin estudiados: la es-timacin en el grupo de sujetos con el acontecimiento de in-ters se realiza a partir de este dato y del RR (vase la fr-mula 14 del apndice). La estimacin se basa, como en elcaso anterior, en la aproximacin normal a la distribucin bi-nomial propuesta por Fleiss19 para contrastes bilaterales.Debe destacarse que valores iguales de OR y de RR requie-ren tamaos de muestra distintos debido a las diferentespropiedades de ambos estimadores de riesgo.

    Comparacin de curvas de supervivencia. Otra forma fre-cuentemente utilizada para estudiar el efecto de un factor ouna intervencin sobre la aparicin de un acontecimiento deinters en diseos longitudinales de cohortes es la compara-cin de curvas de supervivencia estimadas mediante el m-todo de Kaplan-Meier: el contraste de hiptesis generalmen-te se lleva a cabo mediante el estadgrafo de Mantel-Cox. Apartir de ello, y entre otros20, se ha propuesto un mtodo21que precisa una estimacin del RR (o hazard ratio) del grupoexpuesto respecto al control para los clculos. Tambin esnecesario estimar el tiempo que durar el reclutamiento, el

    MEDICINA CLNICA. VOL. 111. NM. 7. 1998tiempo que durar el seguimiento tras finalizar el recluta-miento y la tasa de supervivencia en el grupo control al ini-cio, a la mitad y al final del seguimiento. Si no se prev se-

    0guimiento al final del perodo de reclutamiento se considera-r una supervivencia inicial del 100% y las supervivenciasmedias estimadas a la mitad y al final del reclutamiento, res-pectivamente (vase la frmula 15 del apndice).

    Poder estadstico de un contraste de hiptesis. En los con-trastes de hiptesis tanto entre dos proporciones como en-tre dos medias, es posible calcular a posteriori la potencia opoder estadstico de dicha prueba conociendo el tamaomuestral de cada uno de los grupos comparados. Es tilpara evaluar la calidad del diseo de un estudio publicado,o de una investigacin ya concluida en los que no se esta-bleci el tamao de la muestra en la fase de diseo.El clculo a posteriori de la potencia de un contraste es reco-mendable, sobre todo, ante la sospecha de que la probabili-dad de rechazar la hiptesis alternativa, siendo sta en reali-dad cierta (error de tipo II), es elevada. En este caso, seutiliza como diferencia a detectar como estadsticamente sig-nificativa aquella que se considere clnicamente relevante,independientemente de la que se haya hallado en el estudioen cuestin5,7 (vanse las frmulas 16 a 20 del apndice).

    Muestras de tamao variable Cuando en ensayos clnicos existe la posibilidad de obtenerrespuestas rpidas (el tiempo necesario para la evaluacindel acontecimiento de inters es corto), puede utilizarse undiseo secuencial o un diseo experimental con un solo caso.El diseo secuencial. En este caso, el ensayo slo puede in-cluir 2 intervenciones probadas secuencialmente en cadaparticipante (anlisis con datos apareados) y su resultadodebe poder evaluarse inmediatamente despus de realiza-do. Dicha evaluacin se efecta en trminos de preferenciapor el efecto de una u otra intervencin. Con este tipo de di-seo se pretende minimizar el nmero de pacientes a in-cluir en el estudio, ya que la decisin de continuar reclutan-do a individuos se basa en el resultado obtenido de los queya han entrado. Tal como fueron descritos inicialmente, pueden ser abier-tos, si el nmero de pacientes que pueden entrar en el es-tudio no tiene un lmite preestablecido, o cerrados en casocontrario. El nmero lmite de individuos necesario se calcu-la considerando los riesgos a y b aceptados, y la diferenciade proporciones que se desea detectar como estadstica-mente significativa (hiptesis alternativa), frente a la hipte-sis nula segn la cual la proporcin de preferencias por unau otra intervencin es de 0,5 (50%).Se establece un lmite superior para la proporcin de res-puestas por encima del que se rechaza la hiptesis nula afavor de una intervencin, y uno inferior por debajo del quese rechaza a favor de la intervencin alternativa. Mientras laproporcin se mantenga entre ambos lmites, se consideraque se encuentra en la zona de indecisin; cuando se llegaa alcanzar un cierto nmero de parejas de experiencias sincruzar ninguno de los lmites, esto obliga a aceptar la hipte-sis nula. Los lmites superior e inferior se determinan en fun-cin de los niveles de riesgo a y b previstos, segn diferentesmtodos descritos inicialmente por Armitage22 (fig. 2). Las limitaciones de este tipo de diseo se centran en suspropias condiciones de aplicacin. Tambin es conocido elfenmeno segn el cual, al realizar mltiples contrastes dehiptesis, la probabilidad p final de que alguna alcance el nivel de significacin estadstica es, aproximadamente, elproducto de todos los niveles aceptados en las pruebas in-dividuales. Esto obliga a realizar las oportunas correcciones.

    Los mtodos secuenciales clsicos propuestos por McPher-son y Armitage22 no han sido muy utilizados a causa de es-tas limitaciones.

  • o lo que es lo mismo,

    ai = 0,05/10 = 0,005

    b) Otras formas de distribuir el riesgo a entre las diferentesevaluaciones. En la figura 3 se presenta un ejemplo de cuatroanlisis intermedios secuenciales (que se denominan agrupa-ciones), segn las aproximaciones de Pocock28, Peto29, y OBrien y Fleming30, que son las ms habitualmente utiliza-das31, adems de las descritas. Pueden obtenerse mayoresdetalles sobre los clculos en las referencias citadas.

    Comentarios

    Clculos particulares del tamao muestral

    Se han revisado los mtodos utilizados para el clculo deltamao de la muestra en la mayora de diseos empleadosen los estudios biomdicos. A lo largo de este artculo se ha asumido la normalidad de ladistribucin de las variables continuas. En los casos en losque la distribucin de una variable se aparte mucho de la

    MDiseo experimental de un solo caso. Sera un caso particu-lar del diseo secuencial en el que a un mismo individuo sele administran 2 intervenciones sucesivamente en diversasocasiones evaluando el efecto a cada pareja de resultados.Este tipo de diseo ha sido utilizado en ensayos en enfer-medades psiquitricas23, aunque ms recientemente se hapropuesto un uso ms generalizado en ensayos clnicos te-raputicos de otros mbitos24-26.

    Nivel de significacin estadsticaen los anlisis intermedios

    Los anlisis intermedios tienen implicaciones en el nivel designificacin, ya que aumentan la probabilidad (a causa de la propia repeticin de los contrastes de hiptesis) de unhallazgo fortuito. En otras palabras, el riesgo a es mayorque el previsto para un solo contraste al final del estudio. En los contrastes parciales debe corregirse, por lo tanto, elriesgo a global aceptado. Estos anlisis se utilizan con fre-cuencia en los ensayos clnicos como medida de seguridadante la eventualidad de que el tratamiento evaluado presen-te un beneficio inesperadamente mejor o peor que el con-trol. La decisin de interrumpir el ensayo debe estar basadaen criterios estadsticos claramente definidos. Se trata, enesencia, de distribuir el riesgo de primera especie (a) en-tre todas las evaluaciones parciales, para compensar el au-mento de la probabilidad de hallar una asociacin significa-tiva espuria debido a la realizacin de mltiples contrastesde hiptesis. Estos mtodos se aplican a los estudios conmuestras de tamao fijo en los que se ha planeado efectuarun nmero determinado (generalmente pequeo, entre 2 y5) de evaluaciones con los datos acumulados. Existe uncierto acuerdo en admitir que es mejor establecer el mo-mento de realizar las evaluaciones segn la proporcin desujetos reclutados respecto del planeado. Por ejemplo, al20, 40, 60 y 80% del reclutamiento adems del anlisis fi-nal. Se han descrito varios mtodos para realizar la correc-cin del riesgo a:

    1. Reduccin estocstica. Si en un tiempo t del estudio fal-tan A individuos por evaluar, podemos estimar si se modifi-cara la conclusin del contraste de hiptesis si todos ellospresentasen el efecto opuesto al que se evala (evolucinconservadora del ensayo). En caso negativo, si la probabili-dad de error a es suficientemente pequea (pongamos me-nor que el 5%) est justificado recomendar la interrupcindel ensayo clnico. En un ensayo en el que se evaluaba elefecto de la flecainida y de la encainida frente a placebo so-bre las arritmias ventriculares despus de un infarto de mio-cardio, se interrumpi antes de alcanzarse el tiempo de se-guimiento y el reclutamiento previstos al comprobarse,mediante este mtodo, que ambos frmacos se asociaban amayor mortalidad que el propio placebo27.2. Mtodos por secuencias agrupadas. Existen varios proce-dimientos para establecer criterios de significacin estadsti-ca para evaluar el resultado obtenido en uno o ms anlisisintermedios realizados durante el desarrollo de un ensayoclnico.

    a) Distribucin uniforme. Por su simplicidad es uno de losmtodos ms utilizados para decidir cmo se distribuye elnivel de significacin estadstica entre las evaluaciones, y esel descrito por Armitage22. Cuando se realizan C compara-ciones independientes de una misma variable o grupo devariables, el riesgo de primera especie al final de todas las

    J. MARRUGAT ET AL. ESTIMACIN DEL TAcomparaciones (aef) es realmente

    aef = 1 (1 ai)Csi el riesgo ai en cada i contraste es constante. Por ejemplo,si realizamos 10 contrastes de hiptesis con ai = 0,05:

    aef = 1 (1 0,05)10 = 1 (0,95)10 = 1 0,60 = 0,40

    Para calcular la ai necesaria para obtener una aef de 0,05,utilizaremos la siguiente expresin:

    ai = 1 (1 aef)1/C

    En la prctica, puede utilizarse la siguiente aproximacin:

    ai < aef/C

    Por ejemplo, si realizamos 10 contrastes de hiptesis y que-remos obtener un riesgo aef = 0,05, el riesgo aceptado encada contraste (distribucin del riesgo a) ser:

    ai = 1 (1 0,05)1/10 = 0,005

    AO DE LA MUESTRA EN LA INVESTIGACIN CLNICA Y EPIDEMIOLGICA

    Zona de preferencia por A

    Zona de preferencia por B

    Diferencia irrelevante

    Diferencia irrelevante

    10 20 30 40

    Nmero de parejas de ensayos

    20

    15

    12

    8

    5

    0

    5

    8

    12

    15

    20

    Nmero de preferencias

    A

    B

    Fig. 2. Lmites para la toma de decisiones en un diseo secuencial en que secompara el resultado de dos tratamientos o intervenciones.normal, pueden utilizarse frmulas especficas32,33 o los m-todos paramtricos descritos incrementando el tamaomuestral en un 10%34.

    271

  • En la realizacin de un estudio, las normas ticas requieren

    2Los mtodos de clculo del tamao de la muestra en la re-gresin logstica requieren un comentario aparte. Si bien eltamao de la muestra para una categora de una variablecualitativa puede calcularse mediante el procedimiento des-crito para el contraste de hiptesis con OR, tambin existentablas35 y mtodos de estimacin para variables continuas36.Sin embargo, la complejidad de estos clculos est ms all

    MEDICINA CLNICA. VOL. 111. NM. 7. 1998

    4

    2

    0

    -2

    -4

    Esta

    dgr

    afo

    esta

    ndar

    izad

    o Zi

    Rechazar H0

    Aceptar H0

    Rechazar H0

    Nmero de la agrupacin i1 2 3 4

    Fig. 3. Lmites en los valores estandarizados Z de la distribucin normal paradecidir la hiptesis alternativa en cuatro anlisis intermedios secuencialesagrupados segn tres criterios distintos. h : Pocock; : Haybittle-Peto;* : OBrien-Fleming.de las pretensiones del presente trabajo.Existen alternativas a la estimacin del tamao de la mues-tra centradas en el estudio de los IC de los estimadores11,37.Aunque algo ms intuitivas, las bases del clculo son exac-tamente las mismas que en los mtodos presentados.

    Recomendaciones para los investigadores

    Conviene recordar que la utilizacin de variables continuassuele conducir a muestras menores que la de variables ca-tegricas. El uso de contrastes unilaterales tambin reduceel tamao de la muestra, aunque su empleo debe reservar-se a situaciones en las que realmente sea aplicable. Porotro lado, el uso de diseos con medidas repetidas (datosapareados) generalmente reduce a la cuarta parte el tama-o de la muestra total.En los estudios de casos y controles, la finalidad de la ponde-racin del grupo no expuesto es reducir el tamao de lamuestra en el grupo de sujetos expuestos. Sin embargo, apartir de una ponderacin de 3 a 1 el rendimiento, en trmi-nos de reduccin de sujetos necesarios en el grupo expuesto,se atena sustancialmente. De hecho, pasar de 1 a 2 contro-les por caso implica una reduccin de aproximadamente el25% de expuestos y un incremento del 13% en la muestratotal, y si se emplean 3 controles la reduccin de expuestosllega al 33%, pero el incremento de la muestra total es del35%, y al pasar a 4 controles estas cifras son del 37 y del58%, respectivamente. Este ejemplo se basa en un estudiode casos y controles en el que el porcentaje de controles conel factor de inters fuera del 20% y la OR a detectar como es-tadsticamente significativa de dos. Los riesgos a y b serandel 5 y del 10%, respectivamente, para un contraste bilateral.

    72que el diseo sea correcto y no exponga a seres humanos ariesgos injustificados. Un diseo correcto incluye la estimacinrealista de los pacientes necesarios para obtener el poder es-tadstico suficiente en los contrastes de hiptesis y la precisinadecuada en las estimaciones que se vayan a realizar.Considerando que el clculo del tamao muestral no es msque una estimacin basada en supuestos, adquiere el mxi-mo sentido prever la realizacin de anlisis intermedios deseguridad que permitan interrumpir un ensayo clnico o cual-quier otro tipo de estudio de seguimiento si se alcanzan losniveles de significacin estadstica antes de terminarlo. Encualquier caso, el nivel de significacin no debera utilizarsecomo elemento nico de decisin para la interrupcin de unensayo, puesto que tan slo determina la probabilidad de quelas diferencias obtenidas se deban al azar. Supngase que elnivel de significacin a obtenido en un contraste de hiptesisintermedio fuera del 7%, y el acontecimiento de inters fuerala mortalidad: la posibilidad de detener el estudio debido aesta diferencia debera discutirse por un comit de expertos.Dicho comit tendra en cuenta otros aspectos como el n-mero de pacientes reclutados hasta la fecha del anlisis, elnmero de acontecimientos de inters (fallecimientos en estecaso) ocurridos y el resultado de otros estudios concurrentesen el tiempo en su caso. Tambin debera atender a las con-secuencias de continuar el ensayo clnico en trminos de laactitud de los investigadores a partir de aquel momento y delresto de la comunidad cientfica.

    El software GRANMO para el clculo del tamao de la muestra

    Considerando lo complicado de aplicar los algoritmos declculo manualmente, es til disponer de un programa in-formtico que permita a usuarios no especialistas realizarlas estimaciones ms habituales fiable y rpidamente. Eneste sentido, hemos desarrollado un software de libre difu-sin (shareware)1 denominado GRANMO.El programa GRANMO est dirigido a profesionales de lamedicina, de la epidemiologa y de otras ciencias biomdi-cas interesados en realizar sus propios clculos de tamaode la muestra. Es de fcil manejo y permite su uso en caste-llano, cataln e ingls. Ciertamente, existen otros programas para realizar los cl-culos para la estimacin del tamao muestral. Algunos in-cluyen ms tcnicas estadsticas, pero su manejo requiereconocimientos especializados36,38. Otros cubren pocos tiposde diseo39,40. Excepto el EPIDAT40, ninguno de ellos estdisponible en castellano.

    AgradecimientoLos autores desean expresar su reconocimiento a Cristina Hernn-dez, a Elena Lpez de Brias y a Joan Sancho de la Unidad de In-formtica Mdica del IMIM por la programacin de la versin paraMSWindows del programa GRANMO.

    ApndiceFrmulas para el clculo del tamao de la muestra en los diseos de tamao fijoPara facilitar la notacin se designan los grupos de sujetoscomo controles (c) que reciben un tratamiento estndar o pla-cebo en los ensayos clnicos, o que no han estado expuestos a1Las versiones para DOS y para Windows de este programa puedenobtenerse a travs de las direcciones, postal, electrnica y la siguiente de Internet: HTTP://WWW.IMIM.ES/IMAS/IMIM/PROGRAMES. HTM

  • Afactores o intervenciones en otros tipos de diseo, y como ex-puestos (e) a un factor o a una intervencin experimental.Se denominar Mc a la media de referencia o del grupocontrol, y Me a la de la hiptesis alternativa que se deseadetectar como estadsticamente significativa, X al valor de ladistribucin normal correspondiente al lmite que conduce aaceptar la hiptesis alternativa, Za al valor de la distribucinnormal correspondiente al valor del error a aceptado, Zb alcorrespondiente al error b aceptado, y s la desviacin es-tndar (DE) de la distribucin terica (generalmente obteni-da a partir de un estudio piloto, o de otro estudio). Exceptoen casos particulares, las ecuaciones se presentan para uncontraste unilateral: para un contraste bilateral debe utilizar-se Za/2 en lugar de Za. Se denominar n al nmero de indivi-duos en cada grupo.Todas las frmulas aplicadas a contrastes de hiptesis endos grupos pueden ponderarse de modo que el tamaomuestral (n) de los grupos sea desigual (nc ne). En estecaso el nmero de c es un mltiplo de los e. Esta pondera-cin l se obtiene modificando el numerador en las frmulasen que es aplicable.

    l =

    En los contrastes de hiptesis se requieren siempre los ries-gos a y b aceptados por el investigador. En la estimacin deparmetros poblacionales slo es necesario el riesgo a queafecta al intervalo de confianza.

    Estimacin de parmetros poblacionales

    Estimacin de una proporcin poblacional

    El intervalo de confianza (IC) de una proporcin es IC = P R, donde el recorrido R es:

    R = Za/2 donde P es la proporcin estimada que esperamos hallar, Qes (1 - P) y Za/2 es el valor de la distribucin normal corres-pondiente al valor del error a aceptado en el clculo del ta-mao de la muestra. Despejando n:

    n = (1)

    Estimacin de una media poblacional

    De forma semejante a las proporciones el IC de una mediaM poblacional a partir de una muestra es IC = M R, don-de el recorrido R es:

    R = Za/2 y donde s es la desviacin estndar, (DE), Za/2 es el valor dela distribucin normal correspondiente al valor del error aaceptado y n el tamao de la muestra. Despejando n:

    (2)n = Za/22 s2

    R2

    s2

    n

    Z 2a/2 (P Q)R2

    P Qn

    ncne

    J. MARRUGAT ET AL. ESTIMACIN DEL TSi n es pequea, podra revaluarse sustituyendo Za/2 por ta/2de la distribucin de Student-Eisher.A las frmulas 1 y 2 puede aplicrseles la correccin por fi-nitud de la poblacin cuando sta es inferior a un milln deelementos. Para ello basta multiplicarlas por el siguientefactor:

    POB TM (3)POB

    donde POB es el tamao de la poblacin en que se mues-trea y TM el tamao de la muestra obtenido en las frmulasanteriores.

    Contrastes de hiptesis con medias

    Base para el clculo del tamao muestral

    En la figura 1 puede verse una generalizacin del funda-mento de la estimacin del tamao de la muestra en uncontraste bilateral. En ella se aprecia el punto Mc correspon-diente a la media del grupo de referencia, Me correspon-diente a la media de un grupo con una intervencin alter-nativa y el punto X representa el valor de la distribucinnormal correspondiente al riesgo a/2 aceptado en el con-traste de hiptesis bilateral en la distribucin de media Mcy que define el riesgo b en la distribucin hipotticamen-te distinta de media Me. La zona en negro es la del riesgo ay la sombreada la del riesgo b. Cuando Me > Mc, la distan-cia:

    X Mc = Za/2 y la distancia:

    Me X = Zb donde Za/2 es el valor de la distribucin normal correspon-diente al punto X en la distribucin de referencia de mediaMc, y Zb en la distribucin de media Me. Obsrvese que altratarse siempre de un contraste unilateral en la Zb corres-pondiente a la hiptesis alternativa, se toma la distancia (Me X) para poder tomar el valor Zb positivo; de otro modo,cuando b es menor que 0,50, Zb debera tomar valores ne-gativos. Igualando para X obtenemos:

    Z a/2 + Mc = Zb + Mede donde:

    nc = ne=

    Esta frmula corresponde a un contraste bilateral. Como seha comentado al principio, para un contraste unilateral seutilizar Za. En el resto del apndice se presentan las frmu-las para este tipo de contrastes. Para obtener la frmulapara un contraste bilateral, bastar sustituir Za por Za/2.

    Comparacin de una media observada con una mediapoblacional de referencia

    Puesto que la hiptesis alternativa puede situarse tanto a laderecha como a la izquierda de la nula, la expresin ante-rior se puede convertir en:

    (4)nc = ne= (Za/2 + Zb)2s2

    MeMC2

    (Za/2 + Zb)2s2

    (Me-MC)2

    s2

    ns2

    n

    s2

    n

    s2

    n

    MAO DE LA MUESTRA EN LA INVESTIGACIN CLNICA Y EPIDEMIOLGICAexpresin totalmente equivalente a la anterior en un con-traste unilateral.

    273

  • 27Comparacin de dos medias apareadas (medidas repetidas)en un solo grupo

    El algoritmo de clculo es igual que el anterior, con la salve-dad de sustituir Me- Mc2 por d

    2, siendo este valor d, la

    media de las diferencias individuales entre los valores basa-les y posteriores.

    Comparacin de dos medias apareadas (medidas repetidas)en 2 grupos distintos de sujetos

    En este caso se precisa, adems de los riesgos a y b, unaestimacin de la DE (s) de la medida (que se asumen igua-les para ambos grupos, y tanto en la medida inicial como enla final), la diferencia entre los valores iniciales y finales enlos controles Mdc y en los tratados Mde (y por lo tanto su dife-rencia), y del coeficiente de correlacin r entre la medidabasal y la final, conjunta para los 2 grupos:

    (5)nc = ne=

    Comparacin de dos medias independientes

    Sea Mc la primera media poblacional y Me la segunda, X elpunto de decisin en una escala de diferencias entre me-dias, Za el valor de la distribucin normal correspondiente alvalor del error a aceptado y Zb el correspondiente al error baceptado; s la DE de ambas distribuciones (se asumeniguales para simplificar). La especificacin del error a co-rrespondiente a la hiptesis alternativa (Mc Me 0) llevaa:

    X (Mc Me) = Za + si nc = ne = n,

    X = Za + (Mc Me)De forma similar, la especificacin del riesgo b conduce a:

    (Mc Me) X = Zb de donde:

    X = Za + (Mc - Me)igualando para X y despejando n, cuando nc = ne,

    (6)nc = ne=

    Anlisis de la variancia simple: comparacin de ms de dos medias

    Los clculos propuestos se basan en una correccin paracomparaciones mltiples. Para ello se utiliza un mtodo pa-recido a la distribucin uniforme descrita en el apartado deanlisis intermedios (vase texto). Consiste en dividir el ries-go a global deseado (generalmente 0,05) por el nmero depares de comparaciones posibles entre g grupos del estu-

    (Za + Zb)2 s2

    Mc-Me2

    2s2

    n

    2s2

    n

    2s2

    n

    s2

    ns2

    n

    2 (Za + Zb)2 (1 r) s2

    Mde Mdc2

    MEDICINA CLNICA. VOL. 111. NM. 7. 1998dio. Para 3 grupos seran 3 pares de comparaciones, paracuatro seran 6, etc. Los clculos para la estimacin del ta-mao de la muestra se basan en la ecuacin 6.

    4Contraste de hiptesis con proporciones

    Utilizando un razonamiento semejante al de las medias so-bre la figura 1 y aplicando la aproximacin normal a la dis-tribucin binomial, se puede llegar a las siguientes ecuacio-nes:

    Comparacin de una proporcin observada con una poblacional de referencia

    La ecuacin a que se llega es:

    (7)nc = ne =

    donde P es la proporcin conocida de referencia; Q = (1 P);Pe = proporcin en el grupo expuesto; Qe = (1 Pe); D = (Pe P), y el resto de notacin igual a la de anterioresapartados.

    Comparacin de dos proporciones independientes

    Cuando se cumplen las condiciones de aplicacin de laprueba de c2 para una tabla dos por dos, puede utilizarseesta aproximacin para la estimacin del tamao de lamuestra en la comparacin de proporciones independien-tes. Llamando P a la proporcin media de la proporcin deacontecimientos de inters del grupo control c y del grupotratado t, Q a 1 P, Pc a la proporcin de acontecimientosde inters en el grupo control, Qc a 1 Pc, Pe a la propor-cin en el grupo expuesto, Qe a 1 Pe, D a la diferencia en-tre Pe y Pc, y utilizando el resto de notaciones igual que enapartados anteriores, de forma similar se puede llegar a lasiguiente expresin:

    (8)nc = ne =

    Una alternativa a la ecuacin anterior es la aproximacin si-nusal inversa al clculo de la probabilidad exacta de Fisher.Esta aproximacin est basada en el hecho de que cuandolas proporciones Pc < 0,5, el arcoseno (p) P el seno (p) p. El arcoseno se expresa en radianes. La transformacinde P:

    j(P) = 2 ARCOSENO (P)

    cuyo valor oscila entre 0 y pi, posee la propiedad de que suDE

    1

    n

    es independiente de P. Esta transformacin permite llegar ala expresin siguiente:

    (9)nc = ne =

    Cuando las proporciones se aproximan al 0 o al 100% (di-gamos que son inferiores al 5% o superiores al 95%) debe-ra utilizarse la frmula basada en la distribucin de Pois-son:

    (Za + Zb )2

    2 (ARCOSENO PC ARCOSENO Pe)1

    (Za 2 P Q + Zb Pc Qc + Pe Qe)2

    D2

    (ZaPQ + ZbPeQe)2

    D2(10)nc = ne = (Za + Zb )2 (Pc + Pe)

    Pc Pe2

  • AHiptesis de bioequivalencia: se desea demostrar la hiptesis nula en la comparacin de dos proporciones

    Para contrastes bilaterales (Za/2), la siguiente expresin esmenos conservadora que sus homlogas anteriores:

    (11)nc = ne =

    donde Pc es la estimacin de la proporcin de aconteci-mientos de inters en el grupo control, Qc es 1 Pc, Pe laproporcin en el grupo tratado, y utilizando el resto de nota-ciones igual que en apartados anteriores.

    Tamao muestral en la comparacin de proporciones con datos apareados (medidas dicotmicas antes y despus)

    Se utiliza un clculo basado en la prueba de McNemar. Lafrmula utiliza la proporcin de efectivos positivos (+) y ne-gativos (-) observados en la situacin inicial y en la situacinfinal (antes y despus de una intervencin, por ejemplo) enun mismo grupo de individuos.

    donde, p(i) es la proporcin de positivos (p[i+]) o negativos(p[i]) esperados en la situacion inicial; p(f) es la proporcinde positivos (p[f+]) o negativos (p[f]) en la situacin final.Esta ltima es la fijada por el investigador como la propor-cin mnima en la situacin final a detectar como estadsti-camente significativa.Para una casilla cualquiera, se calculan el valor mximo y elvalor mnimo posibles y las probabilidades condicionales co-rrespondientes. Por ejemplo:

    p(++) mximo = valor mnimo (p[f+], p[i+])p(++) mnimo = p(f+) + p(i+) 1

    A partir de estos valores se calcula, adems, el cocientes:

    s = =

    Suponiendo p(f+) < p(i+), el valor de p(++) mximo = p(f+),por lo que el numerador de la ecuacion anterior se anula y s (p[++] mximo) = 0. Y s (p[++] mnimo):

    sp(++)mn =

    A continuacin, se calculan los tamaos de muestra nece-sarios para las dos probabilidades sp(++)mx y sp(++)mn.

    p(f +) p(++)mnP(f+) + p(i+) 2*p(++)mn

    pf+ p(++)(p(f+) p(++)) + (p(i+) p(++))

    p ( +)p( +) + p(+ )

    (Za/2 + Zb )2 Pc Qc(Pc Pe )2

    J. MARRUGAT ET AL. ESTIMACIN DEL T

    Situacin final

    p(+) p()

    Situacin (+) p(++) p(+) p(i+)inicial

    () p(+) p() p (i)

    p(f+) p(f) 1n(s-mx) =0,25 (Z(a) + Z(b))

    (0,5-0)2*(p(f+) + p(i+)2*p(++)mx)n(s-mn) =

    El tamao de muestra necesario ser la media de las dosn calculadas:

    (12)n =

    Contrastes de hiptesis con odds ratios (OR)

    Se trata en realidad de la frmula utilizada para la compara-cin de proporciones independientes en un contraste bilate-ral. La nica caracterstica destacable proviene en realidadde la forma de calcular la proporcin en los casos (Pca) apartir de la OR y de la proporcin en los controles (Pco):

    (13)Pca =

    donde OR con es la OR estimada que se desea detectarcomo estadsticamente significativa.

    Contraste de hiptesis con riesgos relativos (RR)

    El caso de los estudios de cohorte es semejante al de los decasos y controles. Se utiliza la frmula de la comparacin deproporciones independientes en un contraste bilateral. Lacaracterstica que la distingue del mtodo empleado en losestudios de casos y controles reside en la forma de calcularla proporcin en los expuestos (Pe) a partir del riesgo relati-vo y de la proporcin en los controles (Pc):

    (14)Pe =

    donde RR con es el RR estimado de los expuestos alfactor de inters respecto a los no expuestos que se deseadetectar como estadsticamente significativo.

    Comparacin de curvas de supervivencia

    Para la comparacin de curvas de supervivencia se contras-ta la diferencia entre tasas de mortalidad (o hazard rates) delos 2 grupos, esto es su RR (o hazard ratio). Las propieda-des de la funcin de supervivencia permiten estimar el n-mero de acontecimientos (d) necesarios que deben ocurrirpara detectar como estadsticamente significativo un RR de-terminado por el investigador:

    d =

    donde log(RR con ) es el logaritmo natural del riesgo rela-tivo estimado entre las tasas de mortalidad de los 2 grupos.Para la estimacin del nmero de sujetos necesarios se preci-sa, adems de RR, una estimacin de la mortalidad en elgrupo control (Pc) en tres puntos de la curva: al final del re-clutamiento (Pc,r), a la mitad del tiempo entre el final del re-clutamiento y el final del seguimiento (Pc,[r+f]/2), y al final delseguimiento (Pc,f). El nmero total de sujetos requeridos ser:

    n = (15)d

    4 (Za + Zb)22

    [log(R^R)]2

    R^RPc

    Pco O^R

    Pco O^R + (1 Pco)

    n(s-mx) + n(s-mn)2

    0,25 (Z(a) + Z(b))

    (0,5-s(mn))2*(p(f+) + p(i+)2*p(++)mn)

    MAO DE LA MUESTRA EN LA INVESTIGACIN CLNICA Y EPIDEMIOLGICA1 (Pc,r + 4 Pc, + Pc,r+f)r+f2

    16

    275

  • 2Poder estadstico de un contraste de hiptesis

    Contraste de hiptesis entre dos proporciones con un tamao muestral conocido

    Aproximacin de c2. El poder estadstico (1 b) de un con-traste de hiptesis en el caso de medidas dicotmicas serael rea a la izquierda del punto Zb de la distribucin normal:

    Za + Pc PeZb = (16)

    Aproximacin del seno inverso

    Zb = Za (17)

    +Aproximacin de Poisson

    Zb = Za (18)

    + En los tres casos debe hallarse el valor de b correspondien-te a la Zb en la distribucin normal.

    Contraste de hiptesis entre dos medias con un tamaomuestral conocido

    De forma semejante al apartado anterior, el poder estadsti-co (1 ) en el caso de medidas continuas sera el rea a laizquierda del punto Zb de la distribucin normal.

    Zb = Za (19)

    donde Mc y Me son las medias del grupo control y tratado,respectivamente. El resto de notacin es semejante a la delos apartados anteriores. Si nc = ne, la expresin se reduce a:

    Zb = Za (20)

    REFERENCIAS BIBLIOGRFICAS

    1. GUSTO Investigators. An international randomized trial comparing fourthrombolytic strategies for acute myocardial infarction. N Engl J Med1993; 329: 673-682.

    2. Freiman JA, Chalmers TC, Smith H, Kuebler RR. The importance ofbeta, the type II error and sample size in the design and interpretation ofthe randomized control trial. N Engl J Med 1978; 299: 690-694.

    2 s2

    nc

    MC Me

    (ne + nc) s2

    (nc ne)

    MC Me

    Pene

    Pcnc

    PC Pe

    1ne

    1nc

    2 ARCOSENO PC ARCOSENO Pe

    PeQene

    PcQcnc

    PQne

    PQnc

    MEDICINA CLNICA. VOL. 111. NM. 7. 19983. Moher D, Dulberg CS, Wells GA. Statistical power, sample size, and theirreporting in randomized clinical trials. J Am Med Assoc 1994; 272: 122-124.

    764. Carn X, Moreno V, Porta Serra M, Velilla E. El clculo del nmero depacientes necesarios en la planificacin de un estudio clnico. Med Clin(Barc) 1989; 92: 72-77.

    5. Porta M, Moreno V, Sanz F, Carn X, Velilla E. Una cuestin de poder.Med Clin (Barc) 1989; 92: 223-228.

    6. Lemeshow S, Hosmer DW, Klar J, Lwanga SK. Adequacy of sample sizein Health studies. Nueva York: John Wiley & Sons, 1995.

    7. Meinert CL. Clinical trials. Design, conduct and analysis. Nueva York:Oxford University Press, 1986.

    8. Bland JM, Altman DG. One and two sided tests of significance. Br Med J1994; 309: 248

    9. Pease KE. The alternative hypothesis: one-sided or two-sided? J Clin Epi-demiol 1989; 42: 473-476.

    10. Pocock SJ. Clinical trials: a practical approach. Nueva York: John Wiley& Sons, 1983.

    11. Lemeshow S, Hosmer DW, Klar J. Sample size requirements for studiesestimating odds ratios or relative risks. Statist Med 1988; 7: 759-764.

    12. Plasencia A, Porta Serra M. La calidad de la informacin clnica (y II):significacin estadstica. Med Clin (Barc) 1988; 89: 122-126.

    13. Porta M, Plasencia A, Sanz F. La calidad de la informacin clnica (y III)Estadsticamente significativo o clnicamente importante? Med Clin(Barc) 1988; 90: 463-468.

    14. Lui KJ, Cumberland WG. Sample size requirement for repeated measu-rements in continuous data. Statist Med 1992; 11: 633-641.

    15. Bratcher TL, Moran MA, Zimmer WJ. Tables of sample sizes in theanalysis of variance. J Quality Technology 1970; 2: 156-164.

    16. Kastenbaum MA, Hoel DG, Bowman KO. Sample size requirements:one-way analysis of variance. Biometrika 1970; 54: 421-430.

    17. Eisenhart C. Inverse sine transformation of proportions. En: Eisenhart C,Hastay MW, Vallis WA, editores. Selected techniques of statistical analy-sis. Nueva York: McGraw-Hill, 1947; 395-416.

    18. Makuch R, Simon R. Sample size requirements for evaluating a conser-vative therapy. Cancer Treat Rep 1978; 62: 1.037-1.040.

    19. Fleiss JL. Statistical methods for rates and proportions. Nueva York: Wi-ley & Sons, 1981.

    20. Cantor AB. Sample size calculations for the log rank test: a Gompertzmodel approach. J Clin Epidemiol 1992; 45: 1.131-1.136.

    21. Collet D. Modelling survival data in medical research. Londres: ChapmanHall, 1994.

    22. Armitage P, Berry G. Statistical methods in medical research. Oxford:Blackwell Scientific Publications, 1987.

    23. Barlow DH, Hersen M. Single case experimental designs. Strategies forstudying behavior change (2.a ed.). Nueva York: Pergamon, 1984.

    24. Senn S. Cross-over trials in clinical research. Nueva York: John Wiley &Sons, 1993.

    25. Guyatt G, Sackett DL, Taylor DW, Chong J, Roberts R, Pugsley S. Deter-mining optimal therapy randomized trials in individual patients. N EnglJ Med 1986; 314: 889-892.

    26. Porta M. The search for more clinically meaningful research designs:single-patient randomized clinical trials [editorial]. J Gen Intern Med1986; 1: 418-419.

    27. The Cardiac Arrhythmia Suppression Trial (CAST) Investigators. Increa-sed mortality due to encainide or flecainide in a randomized trial ofarrhythmia suppression after myocardial infarction. N Engl J Med 1989;321: 406-412.

    28. Pocock SJ. When to stop a clinical trial. Br Med J 1992; 305: 235-240.29. Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV et al. De-

    sign and analysis of randomized clinical trials requiring prolonged obser-vation of each patient, I: introduction and design. Br J Cancer 1977; 34:585-612.

    30. OBrien PC, Fleming TR. A multiple testing procedure for clinical trials.Biometrics 1979; 35: 549-556.

    31. Task Force of the Working Group on Arrhythmias of the European So-ciety of Cardiology. The early termination of clinical trial: causes, conse-quences and control. Eur Heart J 1994; 15: 721-738.

    32. Cantor AB. Power estimation for rank tests using censored data: condi-tional and unconditional. Contr Clin Trials 1991; 12: 462-473.

    33. Campbell MJ, Julius SA, Altman DG. Estimating sample sizes for binary,ordered categorical, and outcomes in two group comparisons. Br Med J1995; 311: 1.145-1.148.

    34. Al-Sunduqchi M. Determinig the appropriate sample size for inferencesbased on the Wilcoxon statistics [disertacin]. Laramie: University ofWyoming, PhD, 1990.

    35. Hsieh FY. Sample size tables for logistic regression. Statist Med 1989; 8:795-802.

    36. Hintze JL. SOLO power analysis. Los ngeles: BMDP Statistical Software,1992.

    37. Bristol DR. Samples sizes constructing confidence intervals and testinghypothesis. Statist Med 1989; 8: 803-811.

    38. Elashoff JD. N query advisor. Los ngeles, CA: Dixon Associates, 1995.39. Dean AG, Dean JA, Burton AH, Dicker RC. EpiInfo, version 5. A word

    processing, database, and statistics system for epidemiology on micro-computers. Stone Mountain: USD, Incorporated, 1990.

    40. Alonso JM, Campillo C, Castillo C, Cotos T, Fernndez E, Hervada X et

    al. EPIDAT: anlisis epidemiolgico de datos tabulados. Santiago deCompostela: Xunta de Galicia, 1994.