estadÍstica · estadística es más que eso, en otras palabras es el vehículo que permite llevar...

14
Universidad Politécnica Territorial “José Antonio Anzoátegui” El Tigre, Estado Anzoátegui PNF: Ingeniería Informática Docente: MSc. Liyuan Suárez Estadística Descriptiva Página 1 ESTADÍSTICA La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. La estadística se divide en dos grandes áreas: La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, polígono, pirámide poblacional entre otros. La estadística Inferencial, se dedica a la generación de modelos, inferencias y predicciones asociados a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelación de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos. Al reseñar las dos áreas de la estadística, se puede resumir como sigue el significado de estadística: “La estadística es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre derivada de inferencias inductivas”

Upload: others

Post on 11-Mar-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 1

ESTADÍSTICA

La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica.

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.

La estadística se divide en dos grandes áreas:

La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, polígono, pirámide poblacional entre otros.

La estadística Inferencial, se dedica a la generación de modelos, inferencias y predicciones asociados a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelación de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.

Al reseñar las dos áreas de la estadística, se puede resumir como sigue el significado de estadística:

“La estadística es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de modo que pueda evaluarse la incertidumbre derivada de inferencias inductivas”

Page 2: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 2

VARIABLE Y TIPO DE VARIABLE

Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. Las variables se denotan generalmente con letras mayúsculas X, Y, Z, por ejemplo, X: Estaturas de las personas.

Existen diferentes tipos de variables:

Según la medición

Variables cualitativas

Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valore posibles como si y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como ejemplo los colores.

Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas, por ejemplo: Estatura de las personas. Las variables cuantitativas pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Es decir, los valores que se toma son de números enteros. Ejemplo: El número de hijos {1, 2, 3 hijos,…}.

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores, o sea, puede tomar cualquier valor real. Ejemplo: La estatura {1.65m, 1.68m, 1.70m,…}. Solamente se está limitado por la precisión del instrumento de medición, en teoría permiten que siempre exista un valor entre dos variables.

Según la influencia

Según la influencia que asignemos a unas variables sobre otras, podrán ser:

Variables independientes

Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.

Page 3: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 3

Es aquella característica o propiedad que se supone la causa del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula.

Variables dependientes

Son las variables de respuesta que se observan en el estudio y que podría estar influenciadas por los valores de las variables independientes.

La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Otras

Variable interviniente

Son aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

Variable moderadora

Según Tuckman, representan un tipo especial de variable independiente, que es secundaria y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes.

ESCALAS DE MEDIDAS

Escalas de medición son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las escalas de medición pueden ser clasificadas de acuerdo a una degradación de las características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales. Según pasa de una escala de otra el atributo o la cualidad aumenta. Las escalas de medición ofrecen información sobre la clasificación de variables discretas o continuas, también más conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la selección de la gráfica adecuada.

Escala nominal: Es aquella en que los números sólo se emplean para diferenciar un lugar, objeto o persona. Esta escala de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas. Ejemplos de números con esta característica son los que se usan en las camisetas de los jugadores de fútbol, los que aparecen en el código de barras de un producto, etc. La escala nominal es la escala de medición más débil.

Escala ordinal: Es aquella en que los números se utilizan para diferenciar en orden de supremacía de acuerdo con cierto criterio jerárquico. En esta escala las variables no sólo se asignan a grupos sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los elementos. Ejemplo: Los estratos socioeconómicos.

Escala de intervalos: Es una escala más especializada que la nominal y la ordinal en sentido de que es posible ordenar las mediciones y decir también en cuánto difiere una situación de otra. Esta escala está caracterizada porque tiene una unidad de medida y un origen (cero) arbitrario y así la distancia entre dos mediciones tiene un significado preciso. Las variables medidas al nivel de intervalo se llaman variables de intervalo o variables de escala. Ejemplos de este tipo de variables son la fecha, la temperatura.

Page 4: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 4

Escala de razón: La escala de razón tiene una unidad de medida y un punto de origen no arbitrario (un cero verdadero). La mayoría de las cantidades físicas, tales como la masa, longitud, energía, se miden en la escala de razón. Ejemplos: La edad, estatura, peso corporal, etc.

DISTRIBUCIONES DE FRECUENCIAS

Un conjunto de observaciones puede hacerse más comprensible y adquirir significado mediante un arreglo ordenado. Sin embargo, al agrupar los datos se logra una mayor síntesis. Se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.

Esto proporciona un valor

añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

Tablas de frecuencias para variables cuantitativas

La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. La tabla de frecuencias puede representarse gráficamente en un histograma (Diagrama De Barras).

Variables discretas

Distribución de frecuencias no agrupadas

La distribución de frecuencias no agrupadas en una tabla de frecuencias, se emplea en variables

discretas y/o cuando la amplitud de los datos es pequeña, como se ilustra a continuación.

Ejemplo 1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

Para la construcción de la tabla de frecuencias la ordenaremos de la siguiente manera:

La primera columna de la tabla colocamos la variable de estudio ordenada de menor a mayor.

La segunda columna la llamaremos frecuencia absoluta ( ) y es el recuento de los datos. La suma de las frecuencias es el número total de observaciones (n).

La tercera columna la llamaremos porcentaje o frecuencia porcentual (%) y es cada

frecuencia absoluta ( ), dividido en el número total de observaciones (n) multiplicado por cien.

La cuarta columna la llamaremos frecuencia absoluta acumulada ( ) y es la suma de las frecuencias absolutas.

La quinta columna la llamaremos porcentaje acumulado o frecuencia porcentual acumulada

(% acum.) y es cada frecuencia absoluta acumulada ( ), dividido en el número total de observaciones (n) multiplicado por cien.

Page 5: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 5

Tabla 1. Tabla de frecuencias de las temperaturas máximas registradas durante el mes de julio.

Temperaturas % % acum.

27 28 29 30 31 32 33 34

1 2 6 7 8 3 3 1

3.22 6.45 19.35 22.58 25.81 9.68 9.68 3.22

1 3 9

16 24 27 30 31

3.22 9.68

29.03 51.61 77.42 87.10 96.77 100

Total 31 100

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Para la construcción de una tabla de frecuencias con datos agrupados, se aconseja utilizar la Fórmula de Sturges, para encontrar el número de intervalos y la longitud del intervalo. El número de intervalos se halla por la siguiente fórmula:

( )

en donde n es el número de datos. La longitud que deben tener los intervalos, se obtiene por la fórmula:

donde DM: es el dato mayor, dm: el dato menor y K: el número de intervalos.

El valor de L se toma con un grado de aproximación no mayor a aquel con el que se registran los

datos.

El primer intervalo, tomamos como límite inferior al dato menor y se hace el conteo del valor que arrojó la longitud, teniendo en cuenta que el número del límite inferior también se cuenta y así, obtendremos el límite superior del primer intervalo. Para el siguiente intervalo, se toma el límite superior anterior más una unidad y nuevamente se hace el conteo de la longitud y así sucesivamente, hasta completar el número K de intervalos, o cuando en un intervalo contenga al

mayor de los datos.

Ejemplo 2. Suponga que los siguientes datos corresponden a las puntuaciones del examen de admisión de los aspirantes a una carrera profesional de una universidad. Se toma una muestra de 50 aspirantes y estos son los resultados:

65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71, 68, 66, 56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62.

Solución

Page 6: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 6

Fórmula de Sturges:

Número de intervalos: ( ) Intervalos

Longitud de intervalo:

Una vez determinados los intervalos y la longitud, procedemos a precisar el número de datos (la frecuencia) que caen dentro de cada intervalo. Para ello existe varios métodos de conteo, uno de ellos es hacer una marca, ejemplo / por cada dato que encontremos que cae dentro del intervalo, para otro intervalo se procede de manera similar realizando una marca por cada dato contabilizado.

Otra alternativa para determinar la frecuencia de cada intervalo es construyendo un arreglo de tronco y hoja, que consiste en arreglar los números en columnas, y colocar en la primera el primer dígito y a continuación el segundo dígito como se ilustra enseguida:

5 3 8 5 7 6 9 7 9 8

6 5 3 5 3 9 7 0 1 4 5 4 8 6 0 2 4 5 4 8 6 1 2 3 5 3 7 6 1 2 4 4 3 9 7 6 0 1 2

7 2 1 0

A partir de este arreglo se puede realizar de manera sencilla el conteo de los datos que quedan en cada intervalo.

Ahora podremos hacer la tabla de frecuencias completa (todas las columnas):

Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una universidad.

Clase Puntajes % % acum.

1 2 3 4 5 6 7

53 – 55 56 – 58 59 – 61 62 – 64 65 – 67 68 – 70 71 – 73

54 57 60 63 66 69 72

2 5 9 15 12 5 2

4 10 18 30 24 10 4

2 7 16 31 43 48 50

4 14 32 62 86 96 100

Total 50 100

La clase es la escala nominal de los intervalos y la marca de clase ( ) es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Observe que los intervalos que se han tomado están separados entre sí por una unidad esto es debido a que los datos son de una variable discreta. A estas tablas, es conveniente darle una condición de continuidad, para efectos del cálculo de algunos parámetros o para realizar algunas gráficas. A cada intervalo, al límite inferior se le resta 0.5 y al límite superior se le suma la misma cantidad 0.5. Haciendo estas operaciones a la tabla anterior toma la forma:

Page 7: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 7

Tabla 3. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una universidad.

Clase Puntajes 1 2 3 4 5 6 7

52.5 – 55.5 55.5 – 58.5 58.5 – 61.5 61.5 – 64.5 64.5 – 67.5 67.5 – 70.5 70.5 – 73.5

2 5 9 15 12 5 2

Total 50

Variable continua

Para hacer una tabla de frecuencias con variables continua, se procede de manera similar al de las variables discretas, pero difiere en la construcción de los intervalos. Al primer intervalo se toma el dato menor (límite inferior) y se suma el valor que arrojó la longitud y así, obtendremos el límite superior del primer intervalo. Para el siguiente intervalo, se toma el límite superior anterior y se suma la longitud y así sucesivamente, hasta completar el número de intervalos obtenidos en la fórmula K, o cuando en un intervalo contenga al mayor de los datos. Hay que tener en cuenta que el límite inferior de una clase pertenece al intervalo (intervalo cerrado), pero el límite superior no pertenece al intervalo (intervalo abierto), se cuenta en el siguiente intervalo. Ejemplo [3.1, 3.4) los números que pertenecen a este intervalo son {3.1, 3.2, 3.3}.

Ejemplo 3. Los siguientes datos corresponden al tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción bancaria:

4.1, 3.1, 0.1, 6.5, 5.0, 2,5, 7.4, 10.0, 3.3, 8.0, 2.0, 0.4, 6.4, 1.1, 9.5, 2.8, 1.2, 1.3, 4.1, 9,5, 4.6, 4.3, 3.6, 5.5, 1.4, 2.8, 1.5, 1.6, 7.3, 7.0.

Solución

Fórmula de Sturges:

Número de intervalos: ( )

intervalos

Longitud de intervalo:

La longitud de 1.65 se aproxima a 1.7, debido a que los datos originales (variable continua) son de un solo decimal.

La tabla de frecuencias completa queda:

Page 8: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 8

Tabla 4. Tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción bancaria.

Clase Tiempo % % acum.

1 2 3 4 5 6

[0.1, 1.8) [1.8, 3.5) [3.5, 5.2) [5.2, 6.9) [6.9, 8.6) [8.6, 10.3)

Total 30 100

Completar la anterior tabla.

GRÁFICAS PARA VARIABLES CUANTITATIVAS

En la guía hemos visto cómo organizar una tabla de frecuencias, de un conjunto de datos que contiene la información sobre alguna variable. Esas tablas permiten una lectura más rápida que el listado completo. Ahora veremos cómo presentar esos conjuntos de datos gráficamente. Las gráficas nos permiten visualizar globalmente cómo se distribuyen las frecuencias entre los distintos datos. Hay gráficas de distinto tipo; nosotros podemos ver algunas de ellas en tv, revistas, periódicos, etc. En esta guía aprenderemos a construir y a leer algunas gráficas.

Para ilustrar los diferentes tipos de gráficas tomaremos la tabla de frecuencias (Tabla 2) con la marca de clase y la frecuencia absoluta y absoluta acumulada.

Tabla 5. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una universidad.

Clase Puntajes

1 2 3 4 5 6 7

53 – 55 56 – 58 59 – 61 62 – 64 65 – 67 68 – 70 71 – 73

54 57 60 63 66 69 72

2 5 9 15 12 5 2

2 7 16 31 43 48 50

Total 50

Gráfico de barras de frecuencias

Para construir una gráfica de barras con estos valores tomamos dos ejes perpendiculares; en el eje horizontal señalamos los valores de la variable (puntuaciones) y en el eje vertical señalamos los valores de la frecuencia (número de aspirantes). Como en ambos casos trabajamos con números, para ubicar los valores en cada eje tenemos que considerar una unidad, aunque las unidades del eje horizontal pueden ser distintas a las del eje vertical, como se ilustra a continuación:

Page 9: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 9

Figura 1. Gráfica de barras de frecuencias absoluta.

El gráfico de barras se usa cuando los intervalos están separados entre sí (no existe continuidad entre los intervalos), como lo ilustra la gráfica anterior. Cuando hay una continuidad de los intervalos, se debe graficar un histograma de frecuencias.

Histograma de frecuencias

El histograma de frecuencias es una representación visual de los datos continuos (intervalos sin interrupción). Los histogramas pueden estar referidos a las frecuencias absolutas, relativas (porcentajes) y las frecuencias acumuladas.

La figura 2, es el histograma de frecuencias absolutas correspondiente a la distribución de los puntajes del examen de admisión de 50 aspirantes a una carrera profesional en una universidad (véase tabla 3).

Figura 2. Histograma de frecuencias absolutas

Page 10: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 10

Polígono de frecuencias El polígono de frecuencia se construye sobre el sistema de coordenadas cartesianas, al colocar sobre cada marca de clase un punto a una altura igual a la frecuencia asociada a esa clase; luego se unen dichos puntos por segmento de recta. La figura 3, es el polígono de frecuencias de los datos de la tabla 5.

Figura 3. Polígono de frecuencia absoluta.

Ojiva de frecuencias La ojiva es el polígono que se obtiene al unir por segmentos de rectas los puntos situados a una altura igual a la frecuencia acumulada a partir de la marca de clase como se hizo con el polígono de frecuencia (véase figura 3). La figura 4 es la ojiva de frecuencia de los datos de la tabla 5. Figura 4. Ojiva de frecuencia absoluta.

Page 11: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 11

Tablas y gráficas de frecuencias para variables cualitativas La construcción de una tabla de frecuencias para datos cualitativos requiere sólo del conteo del número de elementos o individuos que caen dentro de cierta clase o tienen determinada característica. En una tabla de frecuencias para datos cualitativos no se dan intervalos de clase por carecer éstos de sentido. Como tampoco existe la frecuencia acumulada. A continuación se muestran tablas y gráficas para datos cualitativos. Ejemplo 4. Los siguientes datos corresponden al número de estudiantes de cierta universidad de acuerdo con su lugar de origen. Tabla 6. Lugar de origen de los estudiantes de una universidad.

Lugar de origen N° Estudiantes

Antioquia Atlántico Cundinamarca Tolima

40 20 50 70

Total 180

Page 12: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 12

Figura 5. Gráfico de barras para datos cualitativos.

En algunos casos es conveniente para propósitos comparativos representar mediante un mismo gráfico dos características que están relacionadas. A continuación presentamos la tabla y gráfica respecto a este caso. Ejemplo 5. En la tabla que sigue se da el número y sexo de los empleados de una empresa en los años comprendidos entre 2009 y 2012. Tabla 7. Número y sexo de los empleados de una empresa.

Sexo

Año

2009 2010 2011 2012

Masculino

Femenino

150 180 200 300

50 70 100 100

Total 200 250 300 400

Page 13: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 13

Figura 6. Histograma doble.

En otros casos lo que nos interesa no es mostrar el número de veces que se da una característica o atributo, sino más bien resaltar la proporción (porcentaje) en que aparece una característica respecto del total. Así por ejemplo, para ilustrar de manera gráfica una situación como la que se presenta en seguida. Ejemplo 6. El número de empleados de una empresa se distribuye porcentualmente de acuerdo con su tiempo de vinculación, como se indica en seguida: Tabla 8. Tiempo de vinculación de los empleados de una empresa.

Tiempo de vinculación Porcentaje

Menos de cinco años Entre cinco y diez años Entre diez y quince años Entre quince y veinte años Más de veinte años

20% 50% 15% 10% 5%

Para construir el diagrama circular partimos del hecho de que un círculo tiene un total de 360°. Luego, mediante una regla de tres simple, repartiremos los 360° en distintos sectores circulares, de acuerdo con cada porcentaje; tenemos así que para determinar el sector circular correspondiente al 20% realizamos la conversión:

Page 14: ESTADÍSTICA · estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con una investigación científica. Es transversal

Universidad Politécnica Territorial “José Antonio Anzoátegui”

El Tigre, Estado Anzoátegui PNF: Ingeniería Informática

Docente: MSc. Liyuan Suárez

Estadística Descriptiva Página 14

Esto es, el 20% corresponde a un sector circular de 72° de medida. A continuación, con ayuda de un transportador, señalaremos el sector circular correspondiente. Igualmente para 50° se tienen 180°, 15% se tienen 54°, 10% se tienen 36° y finalmente para 5% se tienen 18°. La figura 7, muestra la representación gráfica.

Grafica 7. Diagrama circular.

A diferencia de otros tipos de gráficos, el grafico circular no tiene ejes x o y.

El número de elementos comparados dentro de un gráfico circular puede ser de más de 5, y los

segmentos se ordenan de mayor a menor, iniciando con el más amplio a partir de las 12, como en

un reloj. Al igual que en la gráfica de barras, el empleo de tonalidades, colores o patrones de

sombreado facilita la diferenciación de los porcentajes o proporciones.