sesion02

Upload: luisxmiguel

Post on 14-Oct-2015

9 views

Category:

Documents


0 download

TRANSCRIPT

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 1

    Sesin 2

    Introduccin a la Estadstica:

    Descripcin de Datos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 2

    Estadstica Descriptiva

    Datos resumidos y presentados

    convenientemente. Dichos resmenes

    pueden ser:

    tabulares

    grficos o

    numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 3

    Una distribucin de frecuencias es una tabla

    que resume los datos mostrando la frecuencia o

    nmero de elementos que hay dentro de cada una

    de sus clases, que deben ser mutuamente

    excluyentes y colectivamente exhaustivas.

    El objetivo es proveer informacin acerca del

    conjunto de datos que no podra obtenerse

    rpidamente por simple observacin de los datos

    originales.

    Distribucin de frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 4

    Ejemplo: Marada Inn

    A las personas hospedadas en el Marada Inn

    un fin de semana cualquiera, se les pidi que

    contestaran una encuesta con el objetivo de

    evaluar la calidad de las instalaciones del hotel.

    Se les pidi primero, que usando la siguiente escala:

    1=excelente, 2=sobre el promedio, 3=promedio,

    4=debajo del promedio y 5=pobre; calificaran la calidad

    de su infraestructura. Adems, se registr el monto de sus

    cuentas por dicho fin de semana en el hotel, su regin de

    origen (1=norte, 2=centro, 3=sur y 4=extranjero) y la

    edad. La informacin proporcionada por 50 huspedes se

    muestran en la hoja Excel adjunta.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 5

    Distribucin de frecuencias

    Calificacin Frecuencia

    Pobre 9

    Debajo Promedio 8

    Promedio 10

    Sobre Promedio 14

    Excelente 9

    Total 50

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 6

    H I J

    1 Calificacin Frecuencia

    2 Pobre =CONTAR.SI($B$2:$B$51,H2)

    3 Debajo promedio =CONTAR.SI($B$2:$B$51,H3)

    4 Promedio =CONTAR.SI($B$2:$B$51,H4)

    5 Sobre promedio =CONTAR.SI($B$2:$B$51,H5)

    6 Excelente =CONTAR.SI($B$2:$B$51,H6)

    7 Total =SUMA(I2:I6)

    8

    Usando Excel: Funcin CONTAR.SI

    para Construir una Distribucin de

    Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 7

    H I J

    1 Calificacin Frecuencia

    2 Pobre 9

    3 Debajo promedio 8

    4 Promedio 10

    5 Sobre promedio 14

    6 Excelente 9

    7 Total 50

    8

    Usando Excel: Funcin CONTAR.SI

    para Construir una Distribucin de

    Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 8

    La frecuencia relativa de una clase es la fraccin

    o proporcin del total de datos que pertenecen a

    una determinada clase.

    Una distribucin de frecuencias relativas es una

    tabla que nos resume un conjunto de datos

    mostrando la frecuencia relativa para cada clase.

    Distribucin de frecuencias relativas

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 9

    Distribucin de frecuencias relativas

    Calificacin FrecuenciaFrecuencia

    Relativa

    Pobre 9 0.18

    Debajo Promedio 8 0.16

    Promedio 10 0.20

    Sobre Promedio 14 0.28

    Excelente 9 0.18

    Total 50 1.00

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 10

    H I J

    1Calificacin Frecuencia

    Frecuencia

    Relativa

    2 Pobre =CONTAR.SI($B$2:$B$51,H2) =+I2/$I$7

    3 Debajo promedio =CONTAR.SI($B$2:$B$51,H3) =+I3/$I$7

    4 Promedio =CONTAR.SI($B$2:$B$51,H4) =+I4/$I$7

    5 Sobre promedio =CONTAR.SI($B$2:$B$51,H5) =+I5/$I$7

    6 Excelente =CONTAR.SI($B$2:$B$51,H6) =+I6/$I$7

    7 Total =SUMA(I2:I6) =SUMA(J2:J6)

    8

    Usando Excel: Funcin CONTAR.SI

    para Construir una Distribucin de

    Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 11

    H I J

    1Calificacin Frecuencia

    Frecuencia

    Relativa

    2 Pobre 9 0.18

    3 Debajo promedio 8 0.16

    4 Promedio 10 0.2

    5 Sobre promedio 14 0.28

    6 Excelente 9 0.18

    7 Total 50 1

    8

    Usando Excel: Funcin CONTAR.SI

    para Construir una Distribucin de

    Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 12

    Un grfico de barras es una herramienta grfica para trabajar con datos cualitativos.

    En un eje (normalmente el horizontal), colocamos las etiquetas con los nombres de las categoras.

    En el otro eje (normalmente el vertical), se puede usar la frecuencia, la frecuencia relativa.

    Usamos una barra de ancho fijo que dibujamos arriba de cada etiqueta, con una altura de acuerdo con su correspondiente frecuencia.

    Las barras estn separadas para enfatizar que cada clase es una categora diferente.

    Grfico de Barras

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 13

    Calificacin de Calidad Marada Inn

    Grfico de Barras

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 14

    El grfico de pie es una herramienta grfica usada

    generalmente para presentar distribuciones de

    frecuencia relativa de datos cualitativos.

    Primero se traza un crculo; luego usando las frecuencias relativas se subdivide en sectores que corresponden a la frecuencia relativa de cada clase.

    Dado que hay 360 en un circulo, una clase con una

    frecuencia relativa de .25 consumir .25(360) = 90

    de ese crculo.

    Grfico de Pie

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 15

    Grfico de Pie

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 16

    Guas para seleccionar el nmero de clases

    Use entre 5 y 20 clases.

    Conjuntos de datos con un nmero grande de

    elementos, generalmente requieren un nmero

    grande de clases.

    Conjuntos de datos pequeos usualmente

    requieren pocas clases

    Distribucin de Frecuencias

    Para Datos Numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 17

    Gua para seleccionar el Ancho de Clase

    Use clases de igual ancho

    Ancho aproximado de clase =

    Nmero de Clases

    Dato ms grande - Dato ms pequeo

    Distribucin de Frecuencias

    Para Datos Numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 18

    Distribucin Acumulada de Frecuencias muestra el nmero de observaciones con valores iguales o menores que el lmite superior de cada clase.

    Distribucin Acumulada de Frecuencias Relativas muestra la proporcin de tems con valores menores o iguales al el lmite superior de cada clase.

    Distribucin Acumulada de Frecuencias Porcentuales muestra el porcentaje de tems con valores menores o iguales al el lmite superior de cada clase.

    Distribucin Acumulativa

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 19

    La funcin FRECUENCIA no es una funcin

    simple de Excel.

    FRECUENCIA nos proporciona valores mltiples.

    En Excel, la formula que dan como respuesta

    mltiples valores se llaman frmula matricial.

    Una frmula matricial tiene una forma especial de

    ingresar.

    Usando la funcin FRECUENCIA de

    Excel para Construir una Distribucin

    de Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 20

    Pasos para ejecutar esta funcin:

    Paso 1 Seleccionar la matriz donde deben

    aparecer las frecuencias

    Paso 2 Escribir la siguiente frmula:

    {= FRECUENCIA (Datos,Grupos)}

    Paso 3 Presionar CTRL + SHIFT + ENTER

    (La frmula aparecer en toda la matriz

    seleccionada)

    Usando la funcin FRECUENCIA de

    Excel para Construir una Distribucin

    de Frecuencias

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 21

    Montos

    facturadosFrecuencia

    Frecuencia

    Relativa

    Frecuencia

    Relativa

    Acumulada

    Frecuencia

    Relativa

    Acumulada

    50 a 59 2 0.04 0.04 1.00

    60 a 69 13 0.26 0.30 0.96

    70 a 79 16 0.32 0.62 0.70

    80 a 89 7 0.14 0.76 0.38

    90 a 99 7 0.14 0.90 0.24

    100 a 109 5 0.10 1.00 0.10

    Total 50 1.00

    Para el ejemplo, escogemos 6 clases:

    Distribucin de Frecuencias

    Para Datos Numricos

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 22

    Histograma

    El histograma es una manera muy comn de

    presentar grficamente datos cuantitativos.

    La variable de inters se coloca en el eje horizontal.

    Se dibuja un rectngulo arriba de cada intervalo de

    clase con una altura correspondiente a su

    frecuencia, frecuencia relativa, o frecuencia

    porcentual.

    A diferencia del grfico de barras, un histograma

    no tiene separaciones entre rectngulos de clases

    adyacentes

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 23

    Usando herramientas de Excel

    Herramientas

    Anlisis

    de Datos

    Histograma

    Usando Excel para Construir un

    Histograma

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 24

    Usando Excel para Construir un

    Histograma

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 25

    Monto($)

    20

    40

    60

    80

    100

    Fre

    cuen

    cias

    Po

    rcen

    tual

    es A

    cum

    ula

    das

    50 60 70 80 90 100 110

    Ojiva de Frecuencias Porcentuales

    Acumuladas

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 26

    Anlisis Exploratorio de

    Datos

    El Anlisis Exploratorio de Datos es un conjunto de

    tcnicas que usan aritmtica simple y grficos

    fciles de dibujar para resumir datos rpidamente.

    Una de estas tcnicas es el diagrama de hoja y

    tallo.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 27

    Diagrama de Hoja y Tallo

    Cada dgito en el tallo es una hoja.

    Cada lnea en el diagrama se conoce como tallo.

    A la derecha de la lnea, registramos el ltimo dgito de cada dato en orden.

    El primer dgito de cada dato se coloca a la izquierda de una lnea vertical.

    Es muy parecido a un histograma, con la ventaja de que este diagrama conserva los valores originales.

    Un Diagrama de Hoja y Tallo nos muestra ambos el orden y la forma de la distribucin de los datos.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 28

    5

    6

    7

    8

    9

    10

    2 7

    2 2 2 2 5 6 7 8 8 8 9 9 9

    1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9

    0 0 2 3 5 8 9

    1 3 7 7 7 8 9

    1 4 5 5 9

    tallo hoja

    Ejemplo: Marada Inn

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 29

    Dado que tenemos el primer dgito repetido, el

    primer valor corresponde a valores de la hoja de

    0 - 4, y el segundo a valores de la hoja de 5 - 9.

    Si se cree que un diagrama de hoja y tallo est

    muy concentrado, podemos abrir el diagrama

    usando dos tallos para cada dgito inicial.

    Diagrama de Hoja y Tallo

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 30

    5 5 9

    1 4

    7 7 7 8 9

    1 3

    5 8 9

    0 0 2 3

    5 5 5 6 7 8 9 9 9

    1 1 2 2 3 4 4

    5 6 7 8 8 8 9 9 9

    2 2 2 2

    7

    2 5

    5

    6

    6

    7

    7

    8

    8

    9

    9

    10

    10

    Ejemplo: Marada Inn

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 31

    Unidades de la Hoja

    Cuando no se muestran las unidades de la hoja,

    se asume que es 1.

    Las unidades pueden ser 100, 10, 1, 0.1, y as.

    En el ejemplo anterior, la unidad de la hoja fue 1.

    Cada hoja se define por un slo dgito.

    Diagrama de Hoja y Tallo

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 32

    Ejemplo: Unidad de hoja = 0.1

    Si tenemos los siguientes datos

    8

    9

    10

    11

    Unidad de hoja = 0.1

    6 8

    1 4

    2

    0 7

    8.6 11.7 9.4 9.1 10.2 11.0 8.8

    El diagrama de hoja y tallo para estos datos sera:

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 33

    16

    17

    18

    19

    Unidad de hoja = 10

    8

    1 9

    0 3

    1 7

    1806 1717 1974 1791 1682 1910 1838

    El 82 de 1682 Se redondea a 80 y se representa

    por un 8.

    Ejemplo: Unidad de hoja = 10

    Si tenemos los siguientes datos

    El diagrama de hoja y tallo sera:

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 34

    Tablas de Contingencia y

    Diagramas de Dispersin

    Tablas de Contingencia y Diagramas de Dispersin

    son dos mtodos que permiten resumir los datos

    para dos (o ms) variables simultneamente.

    Los gerentes necesitan mtodos que les permitan

    graficar y tabular datos de manera que se entiendan

    las relaciones entre dos variables.

    Hasta el momento hemos visto mtodos que

    resumen datos pero una variable a la vez.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 35

    Tablas de Contingencia

    Tabla de contingencia es una forma de resumir en

    una tabla datos de dos variables simultneamente.

    Se puede usar si:

    ambas variables son cualitativas, o

    Si alguna es cuantitativa, para hacer la tabla debe ser transformada en otra cualitativa.

    Las filas y las columnas definen las clases para

    cada una de las dos variables.

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 36

    El patrn general que muestran los puntos

    sugieren la relacin entre las variables.

    Una de las variables se muestra en el eje vertical

    y la otra en el horizontal.

    Un diagrama de dispersin es una representacin

    grfica de la relacin entre dos variables

    cuantitativas.

    Una lnea de tendencia es una aproximacin de la

    relacin.

    Diagramas de Dispersin y

    Lneas de Tendencia

  • Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2013.

    Anlisis de Datos para la Gerencia 37

    Procedimientos Grficos y Tabulares

    Cualitativo Cuantitativo

    Mtodos

    Tabulares

    Mtodos

    Tabulares

    Mtodos

    Grficos

    Mtodos

    Grficos

    Dist.Frec. Dist.Frec.Relat. Dist.Frec.Porc. Tab.deConting.

    Grfico de Barras

    Grfico de Pie

    Dist. Frec. Dist.Frec.Relat. Dist.Frec.Acum. Dist.Frec.Relat.A

    cumuladas

    Diagrama de Hoja y Tallo

    Tab.deConting.

    Histograma Ojiva Diagrama de

    Dispersin

    Dato