Download - Sesion02
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 1
Sesin 2
Introduccin a la Estadstica:
Descripcin de Datos
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 2
Estadstica Descriptiva
Datos resumidos y presentados
convenientemente. Dichos resmenes
pueden ser:
tabulares
grficos o
numricos
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 3
Una distribucin de frecuencias es una tabla
que resume los datos mostrando la frecuencia o
nmero de elementos que hay dentro de cada una
de sus clases, que deben ser mutuamente
excluyentes y colectivamente exhaustivas.
El objetivo es proveer informacin acerca del
conjunto de datos que no podra obtenerse
rpidamente por simple observacin de los datos
originales.
Distribucin de frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 4
Ejemplo: Marada Inn
A las personas hospedadas en el Marada Inn
un fin de semana cualquiera, se les pidi que
contestaran una encuesta con el objetivo de
evaluar la calidad de las instalaciones del hotel.
Se les pidi primero, que usando la siguiente escala:
1=excelente, 2=sobre el promedio, 3=promedio,
4=debajo del promedio y 5=pobre; calificaran la calidad
de su infraestructura. Adems, se registr el monto de sus
cuentas por dicho fin de semana en el hotel, su regin de
origen (1=norte, 2=centro, 3=sur y 4=extranjero) y la
edad. La informacin proporcionada por 50 huspedes se
muestran en la hoja Excel adjunta.
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 5
Distribucin de frecuencias
Calificacin Frecuencia
Pobre 9
Debajo Promedio 8
Promedio 10
Sobre Promedio 14
Excelente 9
Total 50
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 6
H I J
1 Calificacin Frecuencia
2 Pobre =CONTAR.SI($B$2:$B$51,H2)
3 Debajo promedio =CONTAR.SI($B$2:$B$51,H3)
4 Promedio =CONTAR.SI($B$2:$B$51,H4)
5 Sobre promedio =CONTAR.SI($B$2:$B$51,H5)
6 Excelente =CONTAR.SI($B$2:$B$51,H6)
7 Total =SUMA(I2:I6)
8
Usando Excel: Funcin CONTAR.SI
para Construir una Distribucin de
Frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 7
H I J
1 Calificacin Frecuencia
2 Pobre 9
3 Debajo promedio 8
4 Promedio 10
5 Sobre promedio 14
6 Excelente 9
7 Total 50
8
Usando Excel: Funcin CONTAR.SI
para Construir una Distribucin de
Frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 8
La frecuencia relativa de una clase es la fraccin
o proporcin del total de datos que pertenecen a
una determinada clase.
Una distribucin de frecuencias relativas es una
tabla que nos resume un conjunto de datos
mostrando la frecuencia relativa para cada clase.
Distribucin de frecuencias relativas
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 9
Distribucin de frecuencias relativas
Calificacin FrecuenciaFrecuencia
Relativa
Pobre 9 0.18
Debajo Promedio 8 0.16
Promedio 10 0.20
Sobre Promedio 14 0.28
Excelente 9 0.18
Total 50 1.00
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 10
H I J
1Calificacin Frecuencia
Frecuencia
Relativa
2 Pobre =CONTAR.SI($B$2:$B$51,H2) =+I2/$I$7
3 Debajo promedio =CONTAR.SI($B$2:$B$51,H3) =+I3/$I$7
4 Promedio =CONTAR.SI($B$2:$B$51,H4) =+I4/$I$7
5 Sobre promedio =CONTAR.SI($B$2:$B$51,H5) =+I5/$I$7
6 Excelente =CONTAR.SI($B$2:$B$51,H6) =+I6/$I$7
7 Total =SUMA(I2:I6) =SUMA(J2:J6)
8
Usando Excel: Funcin CONTAR.SI
para Construir una Distribucin de
Frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 11
H I J
1Calificacin Frecuencia
Frecuencia
Relativa
2 Pobre 9 0.18
3 Debajo promedio 8 0.16
4 Promedio 10 0.2
5 Sobre promedio 14 0.28
6 Excelente 9 0.18
7 Total 50 1
8
Usando Excel: Funcin CONTAR.SI
para Construir una Distribucin de
Frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 12
Un grfico de barras es una herramienta grfica para trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamos las etiquetas con los nombres de las categoras.
En el otro eje (normalmente el vertical), se puede usar la frecuencia, la frecuencia relativa.
Usamos una barra de ancho fijo que dibujamos arriba de cada etiqueta, con una altura de acuerdo con su correspondiente frecuencia.
Las barras estn separadas para enfatizar que cada clase es una categora diferente.
Grfico de Barras
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 13
Calificacin de Calidad Marada Inn
Grfico de Barras
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 14
El grfico de pie es una herramienta grfica usada
generalmente para presentar distribuciones de
frecuencia relativa de datos cualitativos.
Primero se traza un crculo; luego usando las frecuencias relativas se subdivide en sectores que corresponden a la frecuencia relativa de cada clase.
Dado que hay 360 en un circulo, una clase con una
frecuencia relativa de .25 consumir .25(360) = 90
de ese crculo.
Grfico de Pie
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 15
Grfico de Pie
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 16
Guas para seleccionar el nmero de clases
Use entre 5 y 20 clases.
Conjuntos de datos con un nmero grande de
elementos, generalmente requieren un nmero
grande de clases.
Conjuntos de datos pequeos usualmente
requieren pocas clases
Distribucin de Frecuencias
Para Datos Numricos
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 17
Gua para seleccionar el Ancho de Clase
Use clases de igual ancho
Ancho aproximado de clase =
Nmero de Clases
Dato ms grande - Dato ms pequeo
Distribucin de Frecuencias
Para Datos Numricos
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 18
Distribucin Acumulada de Frecuencias muestra el nmero de observaciones con valores iguales o menores que el lmite superior de cada clase.
Distribucin Acumulada de Frecuencias Relativas muestra la proporcin de tems con valores menores o iguales al el lmite superior de cada clase.
Distribucin Acumulada de Frecuencias Porcentuales muestra el porcentaje de tems con valores menores o iguales al el lmite superior de cada clase.
Distribucin Acumulativa
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 19
La funcin FRECUENCIA no es una funcin
simple de Excel.
FRECUENCIA nos proporciona valores mltiples.
En Excel, la formula que dan como respuesta
mltiples valores se llaman frmula matricial.
Una frmula matricial tiene una forma especial de
ingresar.
Usando la funcin FRECUENCIA de
Excel para Construir una Distribucin
de Frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 20
Pasos para ejecutar esta funcin:
Paso 1 Seleccionar la matriz donde deben
aparecer las frecuencias
Paso 2 Escribir la siguiente frmula:
{= FRECUENCIA (Datos,Grupos)}
Paso 3 Presionar CTRL + SHIFT + ENTER
(La frmula aparecer en toda la matriz
seleccionada)
Usando la funcin FRECUENCIA de
Excel para Construir una Distribucin
de Frecuencias
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 21
Montos
facturadosFrecuencia
Frecuencia
Relativa
Frecuencia
Relativa
Acumulada
Frecuencia
Relativa
Acumulada
50 a 59 2 0.04 0.04 1.00
60 a 69 13 0.26 0.30 0.96
70 a 79 16 0.32 0.62 0.70
80 a 89 7 0.14 0.76 0.38
90 a 99 7 0.14 0.90 0.24
100 a 109 5 0.10 1.00 0.10
Total 50 1.00
Para el ejemplo, escogemos 6 clases:
Distribucin de Frecuencias
Para Datos Numricos
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 22
Histograma
El histograma es una manera muy comn de
presentar grficamente datos cuantitativos.
La variable de inters se coloca en el eje horizontal.
Se dibuja un rectngulo arriba de cada intervalo de
clase con una altura correspondiente a su
frecuencia, frecuencia relativa, o frecuencia
porcentual.
A diferencia del grfico de barras, un histograma
no tiene separaciones entre rectngulos de clases
adyacentes
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 23
Usando herramientas de Excel
Herramientas
Anlisis
de Datos
Histograma
Usando Excel para Construir un
Histograma
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 24
Usando Excel para Construir un
Histograma
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 25
Monto($)
20
40
60
80
100
Fre
cuen
cias
Po
rcen
tual
es A
cum
ula
das
50 60 70 80 90 100 110
Ojiva de Frecuencias Porcentuales
Acumuladas
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 26
Anlisis Exploratorio de
Datos
El Anlisis Exploratorio de Datos es un conjunto de
tcnicas que usan aritmtica simple y grficos
fciles de dibujar para resumir datos rpidamente.
Una de estas tcnicas es el diagrama de hoja y
tallo.
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 27
Diagrama de Hoja y Tallo
Cada dgito en el tallo es una hoja.
Cada lnea en el diagrama se conoce como tallo.
A la derecha de la lnea, registramos el ltimo dgito de cada dato en orden.
El primer dgito de cada dato se coloca a la izquierda de una lnea vertical.
Es muy parecido a un histograma, con la ventaja de que este diagrama conserva los valores originales.
Un Diagrama de Hoja y Tallo nos muestra ambos el orden y la forma de la distribucin de los datos.
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 28
5
6
7
8
9
10
2 7
2 2 2 2 5 6 7 8 8 8 9 9 9
1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
0 0 2 3 5 8 9
1 3 7 7 7 8 9
1 4 5 5 9
tallo hoja
Ejemplo: Marada Inn
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 29
Dado que tenemos el primer dgito repetido, el
primer valor corresponde a valores de la hoja de
0 - 4, y el segundo a valores de la hoja de 5 - 9.
Si se cree que un diagrama de hoja y tallo est
muy concentrado, podemos abrir el diagrama
usando dos tallos para cada dgito inicial.
Diagrama de Hoja y Tallo
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 30
5 5 9
1 4
7 7 7 8 9
1 3
5 8 9
0 0 2 3
5 5 5 6 7 8 9 9 9
1 1 2 2 3 4 4
5 6 7 8 8 8 9 9 9
2 2 2 2
7
2 5
5
6
6
7
7
8
8
9
9
10
10
Ejemplo: Marada Inn
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 31
Unidades de la Hoja
Cuando no se muestran las unidades de la hoja,
se asume que es 1.
Las unidades pueden ser 100, 10, 1, 0.1, y as.
En el ejemplo anterior, la unidad de la hoja fue 1.
Cada hoja se define por un slo dgito.
Diagrama de Hoja y Tallo
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 32
Ejemplo: Unidad de hoja = 0.1
Si tenemos los siguientes datos
8
9
10
11
Unidad de hoja = 0.1
6 8
1 4
2
0 7
8.6 11.7 9.4 9.1 10.2 11.0 8.8
El diagrama de hoja y tallo para estos datos sera:
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 33
16
17
18
19
Unidad de hoja = 10
8
1 9
0 3
1 7
1806 1717 1974 1791 1682 1910 1838
El 82 de 1682 Se redondea a 80 y se representa
por un 8.
Ejemplo: Unidad de hoja = 10
Si tenemos los siguientes datos
El diagrama de hoja y tallo sera:
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 34
Tablas de Contingencia y
Diagramas de Dispersin
Tablas de Contingencia y Diagramas de Dispersin
son dos mtodos que permiten resumir los datos
para dos (o ms) variables simultneamente.
Los gerentes necesitan mtodos que les permitan
graficar y tabular datos de manera que se entiendan
las relaciones entre dos variables.
Hasta el momento hemos visto mtodos que
resumen datos pero una variable a la vez.
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 35
Tablas de Contingencia
Tabla de contingencia es una forma de resumir en
una tabla datos de dos variables simultneamente.
Se puede usar si:
ambas variables son cualitativas, o
Si alguna es cuantitativa, para hacer la tabla debe ser transformada en otra cualitativa.
Las filas y las columnas definen las clases para
cada una de las dos variables.
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 36
El patrn general que muestran los puntos
sugieren la relacin entre las variables.
Una de las variables se muestra en el eje vertical
y la otra en el horizontal.
Un diagrama de dispersin es una representacin
grfica de la relacin entre dos variables
cuantitativas.
Una lnea de tendencia es una aproximacin de la
relacin.
Diagramas de Dispersin y
Lneas de Tendencia
-
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.
Anlisis de Datos para la Gerencia 37
Procedimientos Grficos y Tabulares
Cualitativo Cuantitativo
Mtodos
Tabulares
Mtodos
Tabulares
Mtodos
Grficos
Mtodos
Grficos
Dist.Frec. Dist.Frec.Relat. Dist.Frec.Porc. Tab.deConting.
Grfico de Barras
Grfico de Pie
Dist. Frec. Dist.Frec.Relat. Dist.Frec.Acum. Dist.Frec.Relat.A
cumuladas
Diagrama de Hoja y Tallo
Tab.deConting.
Histograma Ojiva Diagrama de
Dispersin
Dato