7. graficos ritchey c3.doc

Upload: bikotina

Post on 09-Oct-2015

63 views

Category:

Documents


3 download

TRANSCRIPT

Ritchey, Ferris (2001) Estadstica para las ciencias sociales

Ritchey, Ferris (2001) Estadstica para las ciencias sociales. El potencial de la imaginacin estadstica (Mxico D.F.: McGraw-Hill/Interamericana Editores) Captulo 3: Grficos: una imagen dice ms que mil palabras.CAPTULO 3

GRFICOS: UNA IMAGEN DICE MS QUE MIL PALABRASIntroduccin: presentacin ilustrada de datos Para transmitir un sentido de proporcin, describimos numricamente la distribucin de las puntuaciones de una variable con frecuencias porcentuales, como lo hicimos en el captulo 2. Las distribuciones numricas, sin embargo, tienen sentido slo si una persona tiende a pensar de manera proporcional. Por consiguiente, a menudo nos valemos de recursos grficos y "pictricos", tales como los grficos de pastel para motivar directamente el pensamiento proporcional. Los grficos constituyen un excelente soporte a la clebre mxima: "Una imagen dice ms que mil palabras." Cuando algunas de esas palabras son numricas, una imagen hace ms claros cientos de palabras y clculos.

Debido a lo amigables que son actualmente los programas de cmputo, los medios de comunicacin masiva nos bombardean con grficos, grficos de pastel y pictogrficos (fotografas de objetos, iconos o mapas sombreados). A veces, los programas de cmputo toman vida propia y crean un grfico de forma incorrecta. En trminos del control del error, es importante conocer los clculos matemticos que hay detrs de la construccin grfica y no slo confiar en los programadores.

Los diseos grficos y pictricos se eligen con base en 1) el nivel de medicin de una variable, 2) los objetivos y los aspectos relevantes del estudio, y 3) el pblico a quien se dirigen. Para las audiencias pblicas, los grficos sencillos y a todo color funcionan mejor y brindan una perspectiva global de las estadsticas descriptivas, tales como porcentajes y promedios. En contraste, los pblicos compuestos por especialistas estn acostumbrados a las estadsticas inferenciales aqullas diseadas para explicar y probar hiptesis. Junto con las tablas estadsticas, los grficos nos ayudan a discernir las formas de las distribuciones de frecuencias. Incluso los grficos descriptivos alertan a un analista sobre fuentes de error potenciales que puedan influir en el anlisis realizado.

Lineamientos para graficar

Las presentaciones grficas deben cumplir con algunas reglas y lineamientos simples, los cuales tambin se aplican a las tablas y a la elaboracin de informes.

Lineamientos para graficar

1. Elija el diseo con base en: a) el nivel de medicin de una variable, b) los objetivos del estudio y c) el pblico a quien se dirige.

2. Ante todo, una buena presentacin grfica tiene que ser clara y entendible. Debe simplificar, no complicar.

3. Un grfico o diagrama requiere explicarse por s mismo y transmitir informacin, sin hacer referencia a un texto o a alguien que lo explique. La seleccin cuidadosa de ttulos, descripcin de la escala, subttulos y otras leyendas contribuyen a lograr este objetivo. Someta cada grfico o tabla a la prueba de "perdido en el estacionamiento". Pregntese: Si este grfico fuera abandonado en un estacionamiento, podra tomarlo un perfecto extrao e interpretarlo?

4. Antes de decidirse sobre el tipo de presentacin pictrica (por ejemplo, grfico de pastel contra grfico de barras), elabore bosquejos con varias opciones. Los programas de cmputo hacen esto relativamente fcil. Para ampliar las alternativas, solicite opiniones y consulte otros materiales, tales como informes organizacionales.

5. Adhirase a los principios de inclusividad y exclusividad (captulo 2). Anote al pie de pgina cualquier excepcin.

6. Si los datos no son suyos, indique la fuente de los mismos al final de la tabla.

Graficacin de datos nominales/ordinales

Grficos de pastel

Un estilo simple de presentacin para datos nominales /ordinales es el grfico de pastel. Un grfico de pastel es un crculo que se divide (o rebana) desde su punto central, donde cada rebanada representa la frecuencia proporcional de determinada categora. Todos hemos rebanado pasteles y a veces, no obtenemos una porcin justa. Cuando un investigador quiere ofrecer un sentido de proporcin respecto de una variable nominal/ ordinal, los grficos de pastel son especialmente tiles, pues representan de manera equitativa, tamao relativo o desigualdad entre las categoras. El tamao relativo de una rebanada de pastel es una forma de pensamiento proporcional, con la cual todos estamos familiarizados.

Grfico de pastel

Crculo que se divide (o rebana) desde su punto central, donde cada rebanada representa la frecuencia proporcional de determinada categora de una variable nominal/ ordinal. Es especialmente til para transmitir un sentido de equidad, tamao relativo o desigualdad entre las categoras.

La figura 31 muestra la distribucin del estatus marital en una muestra de 161 personas sin hogar. El rea dentro del crculo entero representa el 100 por ciento de los sujetos en la muestra. El rea de una rebanada indica el porcentaje en una categora especfica. Es fcil percibir que ms de la mitad de los encuestados nunca estuvieron casados, y que una porcin sustancial se haba divorciado. La revelacin ms sorprendente es la parte pequea correspondiente a "casado".

Mientras un programa de cmputo sin dificultad produjo el grfico de pastel de la figura 31, para establecer la relacin entre el grfico de pastel y la distribucin de frecuencias del estatus marital, construyamos el grfico a mano. El primer paso para elaborar cualquier grfico consiste en determinar la distribucin de frecuencias de la variable. Adems, con los grficos de pastel calculamos la frecuencia proporcional y la frecuencia porcentual de cada categora. Las frecuencias proporcionales, junto con el conocimiento sobre las dimensiones de un crculo, sirven para calcular el tamao de las rebanadas.

La divisin correcta del pastel depende de saber que los ngulos que cortan un crculo desde su centro se miden en grados con un transportador (regla circular con forma de media luna). Sin importar el tamao de un crculo, su circunferencia se define por tener una distancia circular total de 360 grados (). Medio crculo tiene 180 o una proporcin de .5 veces 360 grados; y un cuarto de crculo, 90 o .25 veces 360 grados. Estas referencias del crculo se ilustran en la figura 32. Cualquier parte del pastel se rebana multiplicando la proporcin en una categora por 360 grados.

La tabla 31 muestra los clculos para el grfico de pastel que aparece en la figura 31. Cmo se le asigna a cada categora su porcin del pastel? La porcin de una categora es la frecuencia proporcional p por 360, la circunferencia total del pastel. Si .51 (51 por ciento) de los encuestados nunca se haba casado, deben "obtener" 51 por ciento del pastel un valor de 185 o simplemente ms de un medio. Despus de que los 360 grados han sido asignados a todas las categoras, se utiliza un transportador para cortar el pastel en porciones correctamente proporcionadas. Para lograr mayor claridad, se anotan los porcentajes en el grfico de pastel. Si el grfico se presenta ante una audiencia pblica, redondeamos a un porcentaje entero (es decir, la posicin de las unidades).

TABLA 3-1: Hoja de clculo para construir un grfico de pastel: la distribucin del estatus marital para una muestra de 161 personas sin hogar

EspecificacionesClculos

Estatus maritalfp(p) (360)%

Nunca estuvo casado83.515518551%

Divorciado43.26719627

Separado22.13664914

Casado7.0435164

Viudo3.018672

No respondi3.018672

Totales161.9999*360100%

* El total no suma 1.0000 debido a error de redondeo.

Note en la tabla 31 que el porcentaje en la categora "Nunca estuvo casado" se redondea hacia abajo a 51 por ciento, en lugar de hacia arriba a 52 por ciento. Es ms, asignamos a esta categora 185 en vez de 186. Tales ajustes por error de redondeo son necesarios para impedir que el total de grados del crculo exceda los 360, pues un crculo tiene un espacio definido de esa magnitud. Ajustar la categora "Nunca estuvo casado" tiene el menor efecto de error comparado con el ajuste en otras categoras.

Los programas de cmputo (como el SPSS para Windows, el cual es una herramienta para este texto) brindan una amplia gama de estilos para grficos de pastel. Una o ms porciones pueden quedar en relieve o "explotar". Adems existe la posibilidad de presentar grficos de pastel en pares y as poder comparar grupos o periodos.

Grficos de barras

Otra manera para graficar datos nominales/ordinales consiste en utilizar un grfico de barras. Un grfico de barras se compone de una serie de barras verticales u horizontales, donde (n longitud de la barra representa la frecuencia porcentual de una categora de una variable nominal/ordinal. Como una rebanada en un grfico de pastel, el rea de una barra que se determina por su longitud transmite un sentido de frecuencia proporcional de una categora. Los grficos de barras son especialmente eficaces para ilustrar la competencia entre categoras [es decir, qu categora finaliza con la frecuencia ms alta (la barra con la mayor longitud)]. Los grficos de barras se construyen sobre dos ejes: uno trazado horizontalmente (el de las abscisas), y el otro colocado de forma vertical (el de las ordenadas). En otras palabras, las dos lneas se unen en un ngulo de 90 o ngulo "recto". Las categoras de una variable se sitan en un eje; y las marcas para los porcentajes, en el otro. Slo necesitamos calcular la frecuencia porcentual de cada categora para elaborar un grfico de barra.

Grfico de barras

Serie de barras verticales u horizontales, donde la longitud de la barra representa la frecuencia porcentual de una categora de una variable nominal/ ordinal.

Los grficos de barras son especialmente eficaces para ilustrar la competencia entre categoras.

La figura 33 muestra un grfico de barras de la distribucin de frecuencias porcentuales sobre el empleo entre los adultos sin hogar durante la semana previa a la entrevista. La similitud entre la altura de ambas barras indica rpidamente que existen casi tantos adultos sin hogar que trabajan como quienes no.

La figura 34 presenta un grfico de barras "agrupadas", el cual es muy til para comparar a dos o ms grupos en una variable nominal/ ordinal. Esta figura compara la habilidad funcional de 104 pacientes en un hospital de veteranos, y revela cmo la baja capacidad funcional es muy caracterstica en los veteranos enfermos mayores de 70 aos.

Pictogrficos

Los pictogrficos son figuras con forma de objetos que se colocan de manera que el nmero o el tamao de los objetos representen la frecuencia proporcional de una categora. Los pictogrficos a menudo se utilizan en peridicos y revistas. Los programas de cmputo para publicaciones (Desktop publishing) ofrecen una variedad de pictogrficos; la eleccin depende del tema que se analice.

Representacin de variables de intervalo/razn

Histogramas

Nuevamente, el primer paso para elaborar cualquier grfico consiste en organizar las puntuaciones en una distribucin de frecuencias. La tabla desglosada de la tabla 32 presenta la distribucin de frecuencias de las puntuaciones en una prueba de admisin a la universidad llamada Prueba Acadmica Universitaria (PAU), y se trata de una variable medida a nivel de intervalo. Tales datos son ficticios y consisten en una muestra de 110 aspirantes, donde f es la frecuencia de estudiantes por cada puntuacin PAU. Nuestro inters radica en saber cmo se agrupan y se representan las puntuaciones. Fcilmente percibimos que las puntuaciones PAU tienden a agruparse alrededor de 24 y fluctan entre un mnimo de 17 y un mximo de 32. Para graficar los datos, obtenemos un mejor sentido de proporcin sobre cmo se distribuyen las puntuaciones PAU.

La figura 35 muestra estas puntuaciones PAU en un histograma de frecuencias, que es un tipo de grfico utilizado con variables de intervalo/ razn. Un histograma de frecuencias es un diagrama de 90 grados que presenta las puntuaciones de una variable de intervalo/razn, a lo largo del eje horizontal, y la frecuencia de cada puntuacin, en una columna paralela al eje vertical. Un histograma tiene similitudes con un grfico de barras, slo que las columnas del primero se tocan entre s (a menos que una puntuacin tenga una frecuencia de cero casos, por lo que habr una columna faltante). El ancho de cada columna en el histograma es la misma. Las columnas se tocan entre s en los lmites reales de cada puntuacin. Por ejemplo, las puntuaciones en la tabla 32 se redondean al entero ms cercano; en otras palabras, no todos los casos registrados en 24 obtuvieron exactamente el mismo nmero de respuestas correctas.

Con la ampliacin de las columnas para que se toquen entre s, se cumple el principio de la inclusividad. Este histograma transmite el mensaje de que la puntuacin que ocurre con mayor frecuencia es 24, y que la mayora de las puntuaciones de los aspirantes est entre 20 y 28.

Histograma de frecuencias

Diagrama de 90 grados que presenta las puntuaciones de una variable de intervalo/razn a lo largo del eje horizontal, y la frecuencia de cada puntuacin, en una columna paralela al eje vertical.

Polgonos y grficos de lneas

Otra tcnica grfica para representar las variables de intervalo/razn es el polgono de frecuencias o el grfico de lneas. Un polgono de frecuencias es un diagrama de 90 grados con puntuaciones de intervalo/razn sealadas en el eje horizontal, y las frecuencias de las puntuaciones estn representadas por las alturas de puntos localizados sobre las puntuaciones y conectados mediante lneas rectas. Los ejes de un polgono se disean como los de un histograma, es decir, con los valores de una variable en el eje horizontal y las frecuencias trazadas respecto al eje vertical. Sin embargo, para establecer la frecuencia de la variable en una puntuacin particular, utilizamos puntos en lugar de columnas. Mientras los histogramas presentan volumen y destacan el eje horizontal, los polgonos muestran picos y ponen la atencin en el eje vertical. Adems los polgonos comunican un sentido de tendencia o movimiento. Por ejemplo, en la figura 36 el mensaje es que conforme uno asciende en el rango de las puntuaciones PAU, existe una tendencia en las frecuencias de aumentar hasta una puntuacin de 24 y entonces declinar.

Polgono de frecuencias

Diagrama de 90 grados con puntuaciones de intervalo/razn sealadas en el eje horizontal y las frecuencias de las puntuaciones estn representadas por las alturas de puntos localizados sobre las puntuaciones y conectados mediante lneas rectas.

Los polgonos de frecuencias son especialmente tiles para comparar dos o ms muestras. Por ejemplo, comparemos las distribuciones de puntuaciones PAU de los aspirantes tanto a la universidad estatal como a la local. Suponga que la universidad local tiene 204 aspirantes; mientras que la estatal; slo 110. Puesto que los tamaos de las muestras difieren, empleamos un comn denominador para las distribuciones de las puntuaciones PAU para cada escuela: las frecuencias porcentuales. La tabla 33 muestra los clculos, y la figura 37 presenta los dos polgonos. Una vez que estas dos distribuciones se ilustran grficamente, sus diferencias se vuelven bastante claras. Los aspirantes a ambas escuelas tienden a alcanzar entre 15 y 32; pero es ms probable que los aspirantes a la universidad local punten abajo de 22; mientras que los aspirantes a la universidad estatal tiendan a puntuar arriba de 22. Los picos muestran una diferencia en la tendencia central o promedio, que es el tema del captulo 4.

Tabla 3-3 Comparacin de puntuaciones PAU en la universidad estatal y en la universidad local en 198 (datos ficticios).Universidad estatalUniversidad local

Puntuacin PAUfPorcentajefPorcentaje

1600.0%94.4%

1710.9115.4

1810.9146.9

1932.7188.8

2065.42713.2

2198.23416.7

2298.22210.8

231311.8178.3

241816.4128.9

251513.6115.4

261110.094.4

27109.173.4

2876.442.0

2943.631.5

3021.842.0

3100.021.0

3210.900.0

Totales11099.9$*204100.1%*

* Los porcentajes totales no suman 100 debido al error de redondeo.

Los aspirantes a la escuela local comnmente obtienen alrededor de 21; y los aspirantes a la universidad estatal, alrededor de 24.

Histogramas con datos agrupados

Como se analiz en el captulo 2, para obtener mayor claridad en la presentacin de una tabla o grfica, a veces se agrupan las distribuciones de intervalo/razn o "se compactan" en un menor nmero de categoras ordinales. Por ejemplo, la variable edad podra variar desde 1 hasta 100, y un histograma de 100 columnas llenara de cosas innecesarias toda una pgina. As, compactamos esta variable de intervalo/razn en grupos ordenados de edad con un determinado intervalo de aos en cada grupo. En este proceso debemos tener cuidado en seguir el principio de inclusividad; en otras palabras, ninguna edad debe omitirse. Para lograr lo anterior, calculamos los lmites reales del intervalo de puntuaciones de cada grupo, de manera que las columnas del histograma se toquen.

La tabla 34 (que usa datos ficticios) es una reproduccin de una tabla del captulo anterior (tabla 212) con los lmites reales de cada intervalo de puntuaciones aadidos. (Los clculos adicionales en la tabla se registran abajo.) Los lmites reales de un grupo son puntuaciones que caen dentro de dicho grupo, teniendo presente que las puntuaciones individuales se redondean antes de ser agrupadas. As, aquellos en el grupo de 20 a 29 aos podran ser tan jvenes como de 19.5 aos el lmite real inferior de la menor puntuacin en el grupo porque tal edad se redondeara a 20 aos. De igual forma, los sujetos en este grupo podran llegar a tener 29.5 el lmite real superior de la mayor puntuacin en el grupo. Los lmites reales de cada grupo se calculan tomando tanto el lmite real inferior de la menor puntuacin en un grupo como el lmite real superior de la mayor puntuacin en ese grupo.

La figura 38 presenta un histograma de esta distribucin de grupos de edades.

Polgonos con datos agrupados

Para elaborar un polgono con datos agrupados debemos identificar puntos en el eje horizontal, encima de los cuales se sitan las marcas. Empleamos el punto medio del intervalo de puntuaciones de un grupo para la ubicacin de estas marcas, porque esto minimiza el error de agrupamiento.TABLA 34 Hoja de clculo para graficar la variable de intervalo/razn edad, agrupada en categoras ordinales de 10 aos

EspecificacionesClculos

Cdigo

ordinalGrupo

de edadfLmites

reales

del grupoPunto

medio

del grupofporcentualfporcentual

cumulada

120-294719.5-29.524.510.49%10.49%

230-396829.5-39.534.514.1825.67

340-4910639.5-49.544.523.6649.33

450-599649.5-59.554.521.4370.76

560-695359.5-69.564.511.8382.59

670-794569.5-79.574.510.0492.63

180-892479.5-89.584.55.3697.99

890-99989.5-99.594.52.01100.00%

Total448100.00%

Primero, determinamos el ancho del intervalo de las puntuaciones en un grupo. Esto equivale al ancho de las columnas en un histograma: la distancia desde el lmite real inferior de la menor puntuacin en el grupo hasta el lmite real superior de la mayor puntuacin en el mismo. Despus dividimos el ancho del intervalo entre 2 y sumamos el cociente resultante al lmite real inferior de la menor puntuacin en el grupo. En otras palabras, el punto medio de una categora de datos agrupados es el punto equidistante entre los lmites reales superior e inferior del intervalo de puntuaciones en el grupo. Esto transmite la nocin de que el punto medio de un intervalo de puntuaciones se calcula de la misma manera que se encuentra el punto medio de la distancia entre, por ejemplo, dos poblados. Si Larksville est a 20 millas de Rocky City y deseamos llegar hasta el punto medio entre ellos, conducimos el auto 10 millas de Larksville hacia Rocky City o 10 millas de Rocky City hacia Larksville. Aqu tenemos un camino ms corto, una frmula matemtica para localizar el punto medio: simplemente sume los lmites reales superior e inferior y divida el resultado entre 2.

Ahora observemos que el punto medio es un centro geogrfico de un intervalo de puntuaciones. El grupo de edad de 20 a 29 aos tiene un ancho de intervalo de 10 aos y un punto medio de 24.5 aos:

Punto medio de una categora de datos agrupados

Punto equidistante entre los lmites reales superior e inferior del intervalo de puntuaciones en el grupo.

Para construir el polgono (no aparece), nos movemos a lo largo del eje horizontal hasta el punto medio del intervalo de puntuaciones del grupo, y colocamos el punto encima de esa ubicacin, a la altura de la frecuencia para ese grupo. De manera especfica, colocamos el primer punto encima de 24.5 aos hasta una frecuencia de 47; el segundo, encima de una puntuacin de 34.5 hasta una frecuencia de 68, y as sucesivamente. Los extremos del polgono se unen al eje horizontal en el lmite real inferior de todas las edades (es decir, 19.5 aos) y en el lmite real superior de todas las edades (es decir, 99.5 aos).

Representacin grfica de distribuciones de frecuencias acumuladas

Ojivas

Recuerde del captulo 2 que una frecuencia de porcentajes acumulados es la frecuencia porcentual de una puntuacin y la de todas las puntuaciones que la preceden en la distribucin. Las frecuencias porcentuales acumuladas indican qu porcentajes de las puntuaciones de una muestra estn debajo de un valor particular de X. Por ejemplo, en un examen estaramos interesados en saber qu porcentaje de los estudiantes obtuvo 69 aciertos o menos (es decir, no obtuvieron una calificacin mnima de siete). Un polgono de frecuencias acumuladas (o grfico de lneas de frecuencias acumuladas) se llama ojiva.

Ojiva

Polgono de frecuencias acumuladas.

La figura 39 muestra una ojiva que utiliza los datos agrupados de edades de la tabla 34 y el programa SPSS para Windows. El grfico nos da las frecuencias porcentuales acumuladas en el eje vertical, y tales datos vienen de la columna extrema derecha en la tabla 34. Note, sin embargo, que para la edad en el eje horizontal, la ubicacin de las marcas (llamadas seales) no son los puntos medios del grupo. En cambio, las seales son las puntuaciones redondeadas de los lmites reales inferiores de los grupos de edad. Esto tiene sentido. Si queremos saber qu porcentaje de edades es menor que 40, usamos la frecuencia porcentual acumulada de grupos de edad hasta, e inclusive 39. Nos preguntamos qu porcentaje queda debajo de 39.5 aos; pero por claridad usamos 40 aos en la grfica. En la figura 39 percibimos que la grfica empieza a volverse plana en un punto alrededor de los 80 aos, lo cual indica que un porcentaje pequeo de casos se encuentra por arriba de esta edad.

Empleo de grficos con la estadstica inferencial y su aplicacin en la investigacin

Los grficos sirven principalmente para propsitos descriptivos en las audiencias pblicas. En investigacin cientfica y estadstica inferencial, no obstante, a veces graficamos una variable para familiarizarnos con su distribucin y prepararla para el anlisis posterior. Para agilizar esta fase de preparacin, por medio de la computadora generamos histogramas y polgonos (grficos de lneas). En estadstica inferencial, tales grficos son muy tiles para detectar puntuaciones atpicas en una distribucin. Por ejemplo, un grfico que ilustra las tasas de divorcio en 50 estados de la Unin Americana revela que Nevada, con sus leyes que favorecen el divorcio, es notablemente diferente.

Un caso atpico se llama puntuacin desviada o valor extremo, que es una puntuacin que es notablemente diferente de las otras en la distribucin de puntuaciones. Como lo veremos ms adelante, los valores extremos distorsionan los clculos estadsticos, como los promedios. Si las distorsiones son grandes, es necesario desechar o ajustar estas puntuaciones desviadas. Por ejemplo, en el caso de las tasas de divorcio, el procedimiento adecuado podra ser desechar los datos de Nevada. Adems informamos al lector que se trata de un estado excepcional; digno de un estudio de caso (anlisis individualizado) y manifestamos que nuestras conclusiones slo se aplican a los restantes 49 estados. Otra manera de modificar los efectos distorsionantes de los valores extremos consiste en ajustar matemticamente las puntuaciones extremas. Un mtodo involucra tomar el logaritmo de las puntuaciones, una transformacin matemtica que comprime las puntuaciones en un rango menor. Un segundo mtodo radica simplemente en reducir el valor extremo a la prxima puntuacin ms baja o ms alta, que es un procedimiento llamado truncamiento. Una recomendacin final: es impropio omitir o ajustar valores extremos simplemente porque no se ajustan al patrn esperado. El investigador debe explicar claramente las razones tericas y prcticas para realizar tales ajustes. En prximos captulos se abundar sobre los valores extremos.

Puntuacin desviada o valor extremo

Puntuacin que es notablemente diferente de las otras en la distribucin de puntuaciones.

Grficos de caja

Una tcnica grfica muy til para detectar valores extremos es un grfico de caja (grfico de caja y patillas). Los grficos de caja despliegan cuartiles, as como las puntuaciones mnimas y mximas en una distribucin. Tambin identifican los valores extremos (puntuaciones que son mayores a 1.5 de la longitud de la caja hasta un extremo de la distribucin) y las puntuaciones extremas (puntuaciones que son mayores a tres veces la longitud de la caja hasta un extremo de la distribucin). La figura 310 presenta un grfico de caja con los datos de la tabla 211 que aparece en el captulo anterior. La marca que se encuentra hasta la izquierda es un valor extremo, la calificacin de 31, con un 1 al lado que indica el nmero del caso con el valor extremo. La marca en la "patilla" izquierda representa la puntuacin mnima en la distribucin aparte de cualquier valor extremo, una calificacin de 58. La marca en el extremo de la patilla derecha es la puntuacin mxima, una calificacin de 97. Los lados de la caja son los cuartiles primero y tercero, y la marca dentro de la caja es el segundo cuartil.

El grfico de caja de la figura 310 nos dice tanto o incluso ms que la propia tabla de datos. Enfocndonos en Q2 podemos observar que las calificaciones se agrupan hacia la parte superior de la distribucin de puntuaciones; la mitad superior de la clase puntu ms arriba de 85 hasta y la puntuacin mxima que fue 97, una dispersin de slo 12 puntos del examen. Mirando a la izquierda de Q2, vemos que la mitad inferior de las puntuaciones tiene una amplia dispersin de cerca de 30 puntos, descontando slo el valor extremo. En otras palabras, el grfico de caja indica que las calificaciones se inclinaron hacia el extremo superior. En trminos generales, a los alumnos de la clase les fue bastante bien en el examen.

Aunque los grficos de caja pueden construirse a mano, es mejor crearlos por computadora. El SPSS para Windows ofrece muchas opciones para grficos de caja, incluso la opcin de realizar comparaciones en la dispersin de las puntuaciones para dos categoras. Por ejemplo, la figura 311 compara la dispersin de las distribuciones de edad para mdicos hombres y mujeres. El grfico indica rpidamente que, en general, los mdicos mujeres son marcadamente ms jvenes que los hombres. Hay tan pocas mujeres mayores de 55 aos, que tales casos aparecen coma valores extremos.

NSENSATEZ Y FALACIAS ESTADSTICAS

Distorsin grfica

Los grficos y los diagramas ofrecen mapas mentales de conjuntos grandes de datos. Los procedimientos para disear grficos son normativos; es decir, diferentes personas tienen ideas distintas respecto de aquello que agrada al ojo. En otras palabras, la presentacin pictrica es casi un arte.

Puesto que las normas de presentacin de datos son tanto estticas como tcnicas, a menudo son poco claras. Por ejemplo, qu tan amplias deben ser las barras en un grfico? Debemos utilizar una variedad de colores en las barras? Las convenciones que se aplican a stas y a cuestiones similares son flexibles y con frecuencia siguen una moda. El arte inspira la creatividad y la individualidad.

No obstante, cuando las reglas son poco claras es fcil transgredirlas, intencional o involuntariamente. Por ejemplo, con el amplio surtido de programas grficos de computadora disponibles en la actualidad, los usuarios a menudo estn dispuestos a dejar los detalles del grfico en manos del individuo annimo que dise el programa. Como resultado, los medios de comunicacin masiva (en oposicin a los estrictamente cientficos) nos abruman con grficos generados de manera instantnea por la computadora. Cuando usted se convierta en un experto en el pensamiento estadstico, empezar a notar que muchos, sino la mayora de estos "instantneos", son poco confiables en el mejor de los casos (es decir, abiertos a mltiples interpretaciones), y en el peor, incorrectos.

La siguiente parbola ilustra una distorsin grfica comn. El candidato (ficticio) a gobernador Mortimer Mainstreet tena un cmodo margen de dos a uno en las primeras encuestas electorales, sobre su nico serio contendiente, Harry Vace. Poco despus, sin embargo, su delantera empez a revertirse. Se rumora que

Mainstreet est a punto de despedir a su personal de campaa, cuyos miembros ya temen que sus sueos de gobernar el estado se desvanezcan.

La ltima encuesta seala que la ventaja de Mortimer disminuy 2 puntos porcentuales, de 43 a 41 por ciento, con el 16 por ciento an indeciso y un margen de error de ms menos 3 por ciento. La competencia se ha vuelto muy cerrada. En un intento por evitar perder sus empleos, los miembros del personal de campaa informan a Mortimer las puntuaciones que muestra la figura 312. (Si Mortimer Mainstreet se deja llevar por esto, no merece ser gobernador!) Puede identificar todas las cuestiones errneas en este grfico?

Frmulas en el captulo 3

Clculos para los grficos de pastel:

Prepare una tabla desglosada con los siguientes encabezados:

Categorafp(p)(360)%

Clculos para grficos de barra:

Prepare una tabla desglosada con los siguientes encabezados:

Categorafp%

Clculos para histogramas y polgonos de frecuencias:

Prepare una tabla desglosada con los siguientes encabezados:

PuntuacinfLmites reales de la puntuacinPunto medio.

Clculos para histogramas y polgonos de frecuencias con datos agrupados:

Prepare una tabla desglosada con los siguientes encabezados:

PuntuacinfLmites reales del grupoPunto medio del grupo

Clculos para ojivas y grficos de caja:

Prepare una tabla desglosada con los siguientes encabezados:

Puntuacinff porcentualf porcentual acumulada

Para las ojivas, use los lmites reales para localizar las alturas de los puntos. Para los grficos de caja, identifique las puntuaciones y los cuartiles mximo y mnimo.Preguntas para el captulo 3

1. Nombre tres cuestiones que deben tomarse en cuenta al escoger el estilo o el diseo de un grfico.

2. Cul es el principal objetivo al graficar datos?

3. En qu consiste la prueba del "estacionamiento"?

4. Con variables de qu niveles de medida se usan los grficos de pastel y de barras?

5. Con variables de qu niveles de medida se utilizan los histogramas y los polgonos de frecuencias?

6. Bajo qu circunstancias es especialmente til un grfico de pastel?

7. Bajo qu circunstancias es especialmente til un grfico de barras?

8. Explique la relacin entre las puntuaciones redondeadas y los lmites reales de las puntuaciones.

9. La seora Barker est en un autobs con sus 24 alumnos de la clase de quinto grado. Ella va charlando con el conductor del autobs, Kevin Braughn. Si usted fuera a construir un histograma de frecuencias con las edades de los pasajeros del autobs, cmo aparecera? Qu sera peculiar respecto de las edades de la seora Barker y de Kevin? Qu trmino estadstico sirve para describir estas dos puntuaciones?

Ejercicios para el captulo 3

1. En su propuesta presupuestal del prximo ao fiscal, el gobernador de un estado del medio oeste manifiesta que se espera que los porcentajes de recaudacin de varias fuentes sean como sigue (datos ficticios). Elabore un grfico de pastel.

ImpuestoPorcentaje

Ingreso30%

Gasolina12

Ventas21

Otros impuestos y honorarios24

Otras fuentes13

2. Como empleada de una compaa especializada en el cuidado de la salud en el hogar, se le pide a Charlotte que clasifique el tiempo empleado en determinadas tareas en las casas de sus clientes ancianos. La siguiente informacin representa un da tpico de ocho horas (datos ficticios). Elabore un grfico de pastel que ilustre la asignacin del porcentaje de tiempo empleado en varias tareas.

TareaTiempo (horas)

Cocinar y alimentarse1.6

Baarse y vestirse1.0

Leer y charlar2.5

Compras y encargos1.8

Cuidado de la casa1.1

3. Para los pases europeos, Lueschen y cols. (1995) examinaron los gastos en el cuidado de la salud en 1990, como un porcentaje del producto interno bruto (PIB). Elabore un grfico de barras y comente sus resultados.

PasPorcentaje del PIB gastado en el

Cuidado de la salud durante 1990

Blgica7.6%

Francia8.8

Alemania8.3

Pases Bajos8.2

Espaa6.6

4. Lueschen y cols. (1995) analizaron el consumo de alcohol en cinco pases europeos. Elabore un grfico de barras con sus datos y comente sus resultados.

PasLitros consumidos por personas

mayores de 24 aos de edad en 1990

Blgica12.4

Francia16.7

Alemania12.3

Pases Bajos9,9

Espaa15.5

5. Usted realiza un estudio sobre la comparacin histrica respecto del gasto de los recursos fiscales en gobiernos locales y estatales para 1975 y 1995. La fuente de sus datos (ficticios) es la Oficina de Censos de Estados Unidos. Durante esos dos aos, los gobiernos estatales y locales gastaron sus ingresos como sigue:

a) Elabore un grfico con barras agrupadas del tipo de gasto por ao.

b) Comente cmo los gastos de dichos ingresos cambiaron en dos dcadas.

Distribucin por ao

Tipo de gasto19751995

Educacin35%24%

Carreteras918

Salud y asistencia social1832

Otros gastos3826

6. En un estudio sobre los factores que influyen en la conducta desviada en adolescentes, los niveles de educacin de los padres se utilizan para establecer la pertenencia a determinada clase social. Elabore un grfico con barras agrupadas que compare los porcentajes de padres y madres en cada nivel educativo (datos ficticios).

Nivel mximo de educacinMadrePadre

Preparatoria inconclusa12.5%14.5%

Preparatoria terminada59.746.6

Licenciatura terminada27.838.9

7. Alba, Logan y Crowder (1997) examinaron la composicin de barrios tnicos en la ciudad de Nueva York. Un rea de inters es la migracin desde la parte central de la ciudad entre 1980 y 1990. La siguiente tabla muestra las poblaciones de grupos tnicos para un barrio durante esos dos aos.

a) Elabore un grfico de pastel para estos dos aos (en la misma pgina) que represente la poblacin de cada grupo tnico.

b) Elabore un grfico con barras agrupadas para estos dos aos que represente la poblacin de cada grupo tnico.

c) Compare los dos tipos de grficos. En general, qu transmiten los grficos? Qu estilo grfico es mejor para representar el fenmeno? Explique su eleccin.

19801990

AlemanesIrlandesesItalianosAlemanesIrlandesesItalianos

Poblacin46.9209.57050.77318.3009.43641.429

8. Un anlisis de contenido de la publicidad sobre control de peso en Ladies Home Journal revela los siguientes tipos de anuncios, para dos periodos de cinco aos.(datos ficticios).

a) Elabore un grfico de pastel (en la misma pgina) para ilustrar los cambios en las frecuencias porcentuales de los tipos de dietas que se anuncian en los dos periodos.

b) Elabore un grfico con barras agrupadas para ilustrar los cambios en las frecuencias porcentuales de estos anuncios.

c) Compare los dos tipos de grficos. En general, qu transmiten los grficos? Qu estilo grfico es mejor para representar el fenmeno? Explique su eleccin.

Nro. de veces que apareci

Tipo de anuncio sobre prdida de peso1984-19881989-1993

Prdida de peso rpida7847

Sin/ligero de grasa129487

Sin azcar94139

Sin colesterol108262

Otros5232

9. Las siguientes edades corresponden a estudiantes en un grupo de discusin en la universidad: 20,19, 20, 21, 20, 21, 22, 24, 23, 22,19, 20, 21, 21, 22, 23, 22, 20, 21, 21, 23, 29.

a) Elabore un histograma de frecuencias con estos datos (ficticios).

b) Construya un polgono de frecuencias con estos datos,

c) Cul de los dos grficos elegira para presentarlo al pblico en general?

Por qu?

d) Una de las puntuaciones es peculiar. Cmo se le llama a esta peculiaridad?

10. Una universidad pequea tiene inters en incrementar la participacin en las actividades del campus. A una muestra aleatoria de estudiantes se les pidi registrar en una lista a qu eventos asistieron durante el semestre anterior. Los nmeros de los eventos a los que asistieron son los siguientes (datos ficticios): 2, 2, 4, 8, 5, 2, 3, 1, 6, 5, 4, 12, 1, 4, 2, 7, 6, 3, 2, 4, 7, 4, 2, 3.

a) Elabore un histograma de frecuencias con estos datos.

b) Construya un polgono de frecuencias con estos datos.

c) Cul de los dos grficos escogera para presentarlo al pblico en general? Por qu?

d) Una de las puntuaciones es peculiar. Cmo se le llama a esta peculiaridad?

11. Las siguientes distribuciones de frecuencias indican las distancias (en kilmetros) recorridas diariamente por estudiantes de preparatoria, en distritos escolares suburbanos y rurales (datos ficticios).

a) Elabore polgonos de frecuencias para las dos distribuciones en la misma grfica. Precaucin: el tamao de las muestras difiere.

b) Cul es la conclusin obvia al comparar la distancia recorrida para los dos distritos escolares?

KilmetrosSuburbano fRural f

150

241

390

4133

5145

686

769

8512

9417

10224

11015

1208

1307

1402

1501

12. Las siguientes son distribuciones de frecuencias de las edades de pacientes internados en un hospital para tratamiento por abuso de sustancias de acuerdo a los diagnsticos principales de adiccin a la cocana y al alcohol (datos ficticios).

a) Elabore polgonos de frecuencias sobrepuestas con estos datos. Precaucin: el tamao de las muestras difiere.

b) Qu revela el grfico?

EdadAdictos a la cocana fAdictos al alcohol f

2621

2752

2862

29113

30135

3186

3249

33415

34017

35115

3607

3705

3802

Aplicaciones opcionales en computadora para el captulo 3

Si este curso utiliza el disco compacto opcional Computer Applications for The Statistical Imagination, abra los ejercicios del captulo 2. En ellos se describe cmo producir grficos utilizando el SPSS para Windows y cmo elegir estilos grficos adecuados.PAGE 6