Download - Introducción a la Estadística. Tema2
TEMA 2
ESTADÍSTICA DESCRIPTIVA PARA UNA VARIABLE
JGM.03/09/04
TÉCNICAS ESTADÍSTICAS
❚ Las técnicas de estadística descriptiva que pueden aplicarse sobre las tablas de datos dependen de la naturaleza de las variables implicadas:
❙ Técnicas para variables cualitativas❙ Técnicas para variables cuantitativas
JGM.03/09/04
VARIABLES CUALITATIVAS
❚ Lo único que podemos hacer con las variables cualitativas es “contar cuántas veces aparece cada una de sus modalidades en un conjunto de individuos”.
❚ Sólo cabe hacer RECUENTOS y CÁLCULO DE PORCENTAJES.
JGM.03/09/04
FRECUENCIAS ABSOLUTAS Y RELATIVAS
❚ Frecuencias absolutas: recuento del número de individuos que pertenecen a cada una de las modalidades de la variable.
❚ Frecuencias relativas: cálculo del porcentaje de individuos que pertenecen a cada una de las modalidades de la variable.
JGM.03/09/04
FRECUENCIAS ACUMULADAS
❚ Sólo tienen sentido en el caso de variables de tipo ordinal.
❚ Pueden ser absolutas o relativas.❚ Representan el número (o porcentaje) de
pertenecientes “a cada modalidad de la variable ordinal o a las anteriores”.❙ Ejemplo: Personas de clase media o menos,
es decir de clase baja o clase media.
JGM.03/09/04
REPRESENTACIONES GRÁFICAS
❚ La fundamental es el gráfico de barras
(no confundir con un histograma).
❚ Caben otras representaciones como
pictogramas, gráficos de sectores,
etcétera.
VARIABLES CUANTITATIVAS
◆ Medidas de posición.◆ Medidas de dispersión◆ Medidas de simetría◆ Representaciones gráficas
JGM.03/09/04
LAS MEDIDAS RESUMEN
❚ Nos dan una idea de cómo son los valores de la variable que estamos estudiando.
❚ Veremos tres tipos:❙ Medidas de posición o de tendencia central❙ Medidas de dispersión❙ Medidas de asimetría
JGM.03/09/04
MEDIDAS DE POSICIÓN
❚ Nos dan una idea acerca de los valores centrales de la variable, aquellos alrededor de los cuales se acumulan los demás.
❚ Hay tres medidas de posición fundamentales:❙ Media aritmética❙ Mediana❙ Moda
JGM.03/09/04
MEDIA ARITMÉTICA
❚ Es la medida de posición más “popular”❚ Es muy sensible a la existencia de datos
extremos (menos robusta que la mediana).
N
XN
ii
X
∑== 1µ
JGM.03/09/04
MEDIANA
❚ Es aquel valor de la variable que es mayor que la mitad de las observaciones y menor que la otra mitad.
❚ En caso de que el número de observaciones sea par, es la media aritmética de los dos valores centrales.
❚ Es una medida muy robusta, esto es, poco sensible a la existencia de valores extremos.
Es un caso particular del concepto de PERCENTIL
Mediana vs. media
JGM.03/09/04
MODA
❚ Es el valor de la variable que más se repite
❚ Se habla de variables unimodales y multimodales
❚ Es la menos empleada de las medidas de posición
JGM.03/09/04
MEDIDAS DE DISPERSIÓN
❚ Nos dan una idea acerca de la heterogeneidad de la variable.
❚ Estudiamos tres medidas de dispersión:❙ Varianza❙ Desviación estándar o típica❙ Coeficiente de variación
JGM.03/09/04
VARIANZA
❚ Es la medida de dispersión más “popular” junto con la desviación estándar.
❚ Siempre toma valores no negativos.❚ Cuanto mayor sea su valor mayor es la heterogeneidad
de la variable.
( )N
XN
iXi
X
∑=
−= 1
2
2
µσ
MENOS VARIANZA MÁS VARIANZA
JGM.03/09/04
DESVIACIÓN ESTÁNDAR
❚ La varianza está en unidades “al cuadrado”.
❚ Por eso se calcula su raíz cuadrada, la desviación estándar (o desviación típica).
( )N
XN
iXi
XX
∑=
−== 1
2
2
µσσ
JGM.03/09/04
COEFICIENTE DE VARIACIÓN
❚ Ni la varianza ni la desviación estándar están acotadas.
❚ Es necesario contar con un coeficiente relativo: el coeficiente de variación.❙ Ejemplo: elefantes y gatos:
❚ Un CV superior a 1 indica heterogeneidad
X
XCVµσ=
JGM.03/09/04
MEDIDAS DE ASIMETRÍA
❚ Asimetría positiva: cuando existen unos pocos valores extremadamente elevados y la mayoría son bajos.❙ El índice de asimetría es positivo❙ La media es mayor que la mediana
❚ Asimetría negativa: cuando existen unos pocos valores extremadamente bajos y la mayoría son altos.❙ El índice de asimetría es negativo❙ La media es menor que la mediana
❚ Variable simétrica:❙ Índice de asimetría cero❙ La media coincide con la mediana
JGM.03/09/04
MEDIDAS DE ASIMETRÍA
ASIMETRÍA POSITIVA
ASIMETRÍA NEGATIVA
SIMETRÍA
JGM.03/09/04
REPRESENTACIONES GRÁFICAS
❚ La representación gráfica básica es el histograma❙ “Agrupamos” los valores en clases, intervalos (de la
misma longitud) de la variable inicial.❙ Sobre cada intervalo dibujamos un rectángulo de
altura proporcional a la frecuencia absoluta o relativa.
JGM.03/09/04
FUNCIÓN DE DENSIDAD
❚ Si el histograma de la variable representa frecuencias relativas, el área que recoge es 1.
❚ En el límite, cuando el número de clases tiende a infinito, las irregularidades del histograma se suavizan y llegamos al concepto de función de densidad.
JGM.03/09/04
FUNCIÓN DE DENSIDAD (II)
❚ Para ser función de densidad, una función R->R debe cumplir dos propiedades:❙ Tomar siempre valores positivos.❙ El área que encierra bajo ella vale 1.
❚ Un ejemplo muy común de función de densidad es la distribución NORMAL.
JGM.03/09/04
LA DISTRIBUCIÓN NORMAL
• Es unimodal, y la moda y la mediana coinciden con la media.
• Es simétrica alrededor de la media.
• Nunca “toca” el eje de abscisas (es asintótica)
• El área bajo la función es 1.
JGM.03/09/04
LA DISTRIBUCIÓN NORMAL (II)
❚ Tiene dos parámetros que la determinan inequívocamente:❙ Media ❙ Varianza
❚ Por tanto, existen infinitas distribuciones normales.
❚ La tipificación nos permite emplear una única tabla.
µ2σ
JGM.03/09/04
TIPIFICACIÓN
❚ Es el proceso de convertir una variable normal cualquiera en una normal estándar
❚ La puntuación Z mide la lejanía de un individuo respecto a la media y la compara con la lejanía respecto a la media del conjunto de todos los individuos.
❚ A partir de la tipificación (y consultando las tablas adecuadas) podemos calcular probabilidades.
ZX
X
X ≈−σ
µ