0 unidad 4
TRANSCRIPT
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 1
Estadística-Unidad 4
Medidas de Tendencia Central y
Medidas de Dispersión
Herramientas numéricas para el tratamiento
de datos cuantitativos
Tendencia central
Posición
Forma
Dispersión
Media
Mediana
Moda
Cuartiles
Percentiles
Asimetría
Curtosis
Rango - Rango Intercuartílico
Varianza
Desviación Estándar
Coeficiente variación
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 2
Medidas de Tendencia Central
Permiten tener una idea rápida de cómo están
distribuidos los datos
Buscan determinar un valor “común” o valor “central”
alrededor del cual está la mayoría de ellos
0
2
4
6
8
10
12
14
16
2 3 4 5 6 7 8
Nú
mero
de e
xám
en
es
Calificaciones obtenidas
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma
3
Medidas de Posición o de orden Se basan en dividir los datos en porciones (cuartos, décimos)
se busca eliminar del análisis los datos extremos, o analizar
los datos por tramos
Valores que toma la variable en lugares específicos Ej:
percentil 20
Percentiles P10 P20 P30 P40 P50 P60 P70 P80 P90 P100
Curtiles C1 =Q1 C2= Me C3= Q3
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Datos ordenados según su valor Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 4
Medidas de Forma
Junto con la centralidad y la dispersión, conviene ver
otras medidas que tienen que ver con la forma de la
distribución y nos da una información complementaria
Kurtosis Asimetría
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 5
Medidas de Dispersión
Además de conocer el punto central de un conjunto de
datos también interesa conocer su dispersión, es decir
cuán lejos tienden a estar los datos del centro
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 6
Ejemplo 1: Se tienen los exámenes de 29 alumnos de Estadística
con los siguientes valores:
4, 5, 7, 5, 2, 6, 4, 5, 3, 6, 4, 7, 3, 5, 4, 4, 6, 5, 3, 8, 2, 7, 5,
3, 6, 5, 8, 7, 6
Nota: éstos números desordenados son muy difícil de
interpretar
Paso 1: Ordenar mis datos:
2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6,
7, 7, 7, 7, 8, 8
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 7
Paso 2: se debe confeccionar una “Tabla de Frecuencias” (cuando son muchas categorías es útil agrupar los datos en “intervalos de clase” - Regla empírica: entre 6 y 15 intervalos)
Calificación (valor) (x1)
Nº de pruebas (Frecuencia) ( f1)
2 2 3 4 4 5 5 7 6 5 7 4 8 2
Observar los valores !!!
0
1
2
3
4
5
6
7
8
2 3 4 5 6 7 8
Núm
ero
de e
xám
enes
Calificaciones obtenidas
Paso 3: Aplicar las técnicas de tratamiento de datos
cuantitativos Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 8
Medidas de Tendencia Central
0
2
4
6
8
10
12
14
16
2 3 4 5 6 7 8
Nú
mero
de e
xám
en
es
Calificaciones obtenidas
Media, Mediana y Moda
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 9
La media Resulta de dividir la suma de todos los
valores observados de la variable por el
número de observaciones
datos no agrupados
datos agrupados
Símbolos: `X para una muestra (x barra) y
m para una población (mu)
Unidad 4: Medidas de Tendencia Central y de Forma 10 Estadística - FHyCS
...21
n
x
n
xxxx
in
n
fx
n
fxfxfxx
iiyy
....... 2211
Descripción de un conjunto de datos más elemental:
su “centro”
Media o promedio: el “centro de gravedad”
Ejemplos: la nota media en un examen, ingreso
medio por familia, número de hijos medio por pareja
MUY IMPORTANTE: la media no tiene por qué ser
“representativa”
Cuando puede utilizarse?
Cuando los datos estén agrupados en torno a un
valor central
No debe utilizarse cuando estén muy dispersos, o
tienen valores extremos
Unidad 4: Medidas de Tendencia Central y de Forma 11 Estadística - FHyCS
Ventajas y Desventajas de la Media: Ventajas:
Toma en cuenta todos los valores
Es de fácil cálculo e interpretación
Se puede usar para cálculos
Permite estimar totales a partir de muestras
Desventajas:
Muy afectada por valores extremos
No puede calcularse en el caso de intervalos de
clase abierto.
Unidad 4: Medidas de Tendencia Central y de Forma 12 Estadística - FHyCS
Propiedades de la Media: Suma de las desviaciones de un conjunto de
observaciones respecto a su media, es igual a
cero
La media puede verse muy afectada por unas
pocas observaciones cuyo valor sea muy diferente
de los demás, valor atípico (outlier)
Cuando el gráfico que representa la distribución
de valores no es simétrico, sino sesgado, la media
está desviada, hacia la cola más larga.
Cuanto más sesgada es la distribución: menos
representativa es la media
Unidad 4: Medidas de Tendencia Central y de Forma 13 Estadística - FHyCS
0 ~ xxi
Ejemplo 1 – Cálculo de la Media
07.529
147
29
8...322x
07.529
147
29
)28(..)43()22(x
xxx
Interpretación: el promedio de las evaluaciones del exámen de
Estadística es de 5.07
o
n
fixix
.~
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 14
...21
n
x
n
xxxx
in
Mediana: Si todos los valores se ordenan de menor a mayor, es
el valor que divide el conjunto de datos en dos mitades
con igual número de observaciones hacia cada lado
El valor de mediana puede ser uno directo o el
promedio de dos valores directos
Símbolo: Mdn
Propiedades:
La Mediana es menos sensible a datos extremos.
La mediana es más sensible que la media a la
variabilidad en el muestreo.
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 15
Ventajas y Desventajas de la Mediana Ventajas:
Fácil cálculo
Es posible utilizar intervalos abiertos
No está afectada por valores extremos
Desventajas:
No utiliza todos los valores
No hay una fórmula matemática sólo aproximación.
No puede usarse para cálculos
No puede obtenerse una medida total. Unidad 4: Medidas de Tendencia Central y de Forma 16 Estadística - FHyCS
En nuestro ejemplo (muestra impar):
2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6,
6, 6, 6, 6, 7, 7, 7, 7, 8, 8
Mediana: Fórmula y cálculos
2
2
2
ny
nMnaPosición
2
1
nMnaPosición
15 nº posición2
30
2
129
MnaPosición
Muestras
pares
Muestras
impares
Posición nº 15
Interpretación: el Valor de la Mediana es “5”
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 17
La moda El valor de mayor frecuencia
Si hay dos, la distribución es “bimodal”
es el valor que más se repite en un conjunto de datos.
Símbolo: Mo
En nuestro ejemplo el número que más se repite es el
número “5”
Medidas de Resumen de nuestro ejemplo:
Media: 5,0
Mediana: 5
Modo: 5
Interpretación: el conjunto de datos de éste ejemplo presenta una
distribución “simétrica”
0
10
20
30
40
50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 18
Ventajas y Desventajas del Modo Ventajas:
Fácil cálculo
No está afectado por valores extremos
Puede obtenerse con cualquier escala
Desventajas:
Afectado por el redondeo y agrupamiento de datos
No utiliza todas las observaciones
Pueden ser 1,2, 3 o 0
No pueden hacerse cálculos
Unidad 4: Medidas de Tendencia Central y de Forma 19 Estadística - FHyCS
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
Moda
Mediana Media
Distribución sesgada a la Derecha – A. positiva
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9 10 11 12 13
Moda
Mediana
Media
Distribución sesgada a la izquierda
Asimetría negativa
0
10
20
30
40
50
60
70
80
90
1 2 3 4 5 6 7 8 9 10 11 12 13
Distribución simétrica
Moda
Mediana
Media Cuando hay datos
extremos muy diferentes
se debe usar la mediana
como medida del
“centro”.
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 20
Relación entre Medidas:
DISTRIBUCIÓN RELACIÓN
Simétrica Media=Mediana =Modo
Asimétrica
Positiva Mo<Me<Media
Negativa Media<Me<Mo
Unidad 4: Medidas de Tendencia Central y de Forma 21 Estadística - FHyCS
Gráfico Resumen: Cajas y bigotes
Presenta al mismo tiempo una medida de dispersión,
tendencia central y de valores extremos
Se debe determinar la mediana, el primero y el tercer
cuartil y los valores máximo y mínimo y el rango IC
Gráfico confeccionado con software Infostat
Ejemplo: Máximo Máximo
Mediana Cuartil 1
Mínimo
8
6
5
4
2
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 22
Cuartil 3
Mínimo
Gráfico de Caja y Bigotes (Box-plot)
Escala
Q1 Q3 mediana
Max Min
Especialmente útiles cuando queremos comparar
varios conjuntos de datos
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 23
Ejercicio a resolver:
En un diario de tirada nacional presentan el siguiente gráfico de
caja y bigotes. La variable en estudio es “calificación en un
examen de ingreso”
Teniendo en cuenta esta gráfica indique en forma aproximada:
a)¿Qué calificación obtuvo el estudiante con menor nota?
b)¿Qué calificación obtuvo el estudiante con mayor nota?
c)¿Cuál es el primer cuartil?
d)¿Cuál es el tercer cuartil?
e)¿Cuál es la mediana?
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 24
Medidas de Dispersión
Rango, Varianza, Desviación Media,
Desviación Tipo
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 25
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Dos conjuntos de datos pueden tener la
misma media pero ser muy distintos
13, 15, 17, 21, 23, 25 (media es 19)
3, 5, 7, 31, 33, 35 (media es 19)
Diferencia: dispersión respecto a media
Consecuencia: junto a la media (central)
es necesario otro valor que exprese la
dispersión.
Unidad 4: Medidas de Tendencia Central y de Forma 26 Estadística - FHyCS
El rango o recorrido
La diferencia entre el máximo y el mínimo
de los valores de la población
Es de fácil cálculo
Muy afectado por los valores extremos
No toma en cuenta todas las observaciones
No puede hacerse operaciones algebraicas
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 27
minmaxe xxR
Desviación Media Promedio de las distancias de los valores
observados respecto a la media.
Cálculo: la media de las desviaciones respecto a
la media
Problema: el numerador es cero (se compensan)
Solución: elevar al cuadrado, calcular la media
de los cuadrados, y hallar la raíz cuadrada
Unidad 4: Medidas de Tendencia Central y de Forma 28 Estadística - FHyCS
n
xxiDM
~
Desviación media: Ejemplo 2: hallar la desviación media de
la serie Xi = 2, 3, 5, 8 y 12
Usa valores absolutos (sin tomar en
cuenta el signo).
Unidad 4: Medidas de Tendencia Central y de Forma 29 Estadística - FHyCS
65
30 x~
2,35
16
5
6 ~
xi
n
xxiDM
Desviación Tipo o Estándar Indica como se dispersan los datos por
encima y por debajo de la media.
Es igual a la raíz cuadrada de la varianza
Símbolo:
S para una muestra
s para una población (sigma)
Unidad 4: Medidas de Tendencia Central y de Forma 30 Estadística - FHyCS
n
xxiSDS
2)~(
Varianza: Promedio de los cuadrados de las
desviaciones de la media.
Valores más altos de varianza indican que
los datos están más dispersos (alejados
de la media)
Se expresa en unidades al cuadrado
(difícil interpretación) Unidad 4: Medidas de Tendencia Central y de Forma 31 Estadística - FHyCS
)~
Varianza
22
n
x(xi - S
Cálculo alternativo de la DT o DS
Igual que la media, cuando hay valores
repetidos, la desviación típo también
puede calcularse con esta otra fórmula:
Si tenemos intervalos de clase el xi es la
marca de clase del intervalo
Unidad 4: Medidas de Tendencia Central y de Forma 32 Estadística - FHyCS
n
fxxSDS
ii
.)~( 2
Propiedades de la DT Siempre valor positivo
Sólo valor 0 si todas las observaciones tienen el
mismo valor
Ventajas:
Está definida rigurosamente
Se basa en todos los valores
Fácil cálculo
Se pueden realizar operaciones algebraicas
Desventajas:
Como la media, muy afectada por valores atípicos
Unidad 4: Medidas de Tendencia Central y de Forma 33 Estadística - FHyCS
Observaciones e Interpretación: Por razones técnicas (matemáticas), cuando se calcula la
desviación típica y la varianza de una muestra, en lugar de
la de una población, el denominador es (n-1) en lugar de n
Mide la dispersión: cuanto más grande, mayor dispersión.
Es la “media de las desviaciones respecto a la media”
Unidades: las mismas en las que se exprese la variable
(pesos, metros, puntos en examen...)
¿Grande o pequeña? Según lo que sepamos de la variable
misma
IMPORTANTE: si la DT es mayor que la media indica
asimetría (sesgo), si no es menor que la mitad de la media
cuidado!, puede haber sesgos.
Unidad 4: Medidas de Tendencia Central y de Forma 34 Estadística - FHyCS
Cálculo de DS Ejemplo – Tabla 4 – Unidad 3
Edad Marca de
clase (xi)
Frecuencia
fi
fi.xi Xi -`X (xi - `X )2 fi.(xi -`X)2
1-11 6 8 48 -16,775 281,400625 2251,205
12-22 17 13 221 -5,775 33,350625 433,558125
23-33 28 14 392 5,225 27,300625 382,20875
34-44 39 2 78 16,225 263,250625 526,50125
45-55 50 1 50 27,225 741,200625 741,200625
56-66 61 2 122 38,225 1461,150625 2922,30125
40 911 7256,975 7256,975
Unidad 4: Medidas de Tendencia Central y de Forma 35 Estadística - FHyCS
775,2240
911.
n
fxx
ii 4,13 4,180 .)~( 2
n
fxxS
ii
Interpretación de las medidas: `X = 22,7 años
Mo = 24 años
Mdn = 22 años
Q1 = 17 años ; Q3 = 23 años
DS = 13,4 años
El promedio de edad de los lesionados es de 22,7
años, con una dispersión tipo de más o menos 13,4
años. El 50% de los valores se encuentra entre los
17 y 23 años.
Se puede utilizar Archivo Excel Unidad 4.XLSX y
Archivo Infostat Unidad 4.IDB2
Unidad 4: Medidas de Tendencia Central y de Forma 36 Estadística - FHyCS
Tratamiento de Datos:
Resumen descriptivo que se realiza para la
organización, representación y medición de datos.
Unidad 4: Medidas de Tendencia Central y de Forma 37 Estadística - FHyCS
Tratamiento de Datos
de
Variable Cualitativa
nominal
Tablas de Frecuencia
Gráficos: Diagrama de
barras. Diagrama de
Pareto. Gráfico circular o
de sectores.
Medidas: de Tendencia
central: Moda
Tratamiento de Datos:
Resumen descriptivo que se realiza para la
organización, representación y medición de datos.
Unidad 4: Medidas de Tendencia Central y de Forma 38 Estadística - FHyCS
Tratamiento de Datos
de
Variable Cualitativa
ordinal
Tablas de Frecuencia
Moda
Gráficos: Diagrama de
barras. Diagrama de
Pareto. Gráfico circular o
de sectores.
Medidas: de Tendencia
central: Moda y Mediana
Tratamiento de Datos:
Resumen descriptivo que se realiza para la
organización, representación y medición de datos.
Unidad 4: Medidas de Tendencia Central y de Forma 39 Estadística - FHyCS
Tratamiento de Datos
de Variable
Cuantitativa Discreta
Tablas de Frecuencia: serie
simple y datos agrupados.
Gráficos: Diagrama de
barras. Diagrama de Caja.
Gráfico de frecuencias
acumuladas.
Medidas: de Tendencia
central, posición, dispersión
y de forma
Tratamiento de Datos:
Resumen descriptivo que se realiza para la
organización, representación y medición de datos.
Unidad 4: Medidas de Tendencia Central y de Forma 40 Estadística - FHyCS
Tratamiento de Datos
de Variable
Cuantitativa continua
Tablas de Frecuencia:
para datos agrupados.
Gráficos: Histograma,
Ojiva, Polígono de
frecuencias, Tallos y Hojas
Gráfico de Caja.
Medidas: de Tendencia
central, posición, dispersión
y de forma
¿Qué hemos visto?
Medidas de Tendencia Central
Media
Mediana
Moda
Medidas de Dispersión
Varianza
Desviación Media
Desviación Tipo
Rango o Recorrido
Ejemplos y Ejercicios
Unidad 4: Medidas de Tendencia Central y de Forma 41 Estadística - FHyCS
Actividades:
Conformación de grupos de trabajo ( no
más de cinco integrantes)
Planteo y resolución de los Ejercicio n° 1
y 5 de ambas series en forma grupal y
presentación en forma oral de un grupo
elegido al azar.
Realice los Ejercicios de aplicación de la
Guia de Aprendizaje N°4.
Unidad 4: Medidas de Tendencia Central y de Forma 42 Estadística - FHyCS
Bibliografía:
Cap. 2 y 3 “Estadística Fácil”, Clegg F., 1984,
Ed. Crítica. España.
Apuntes de la Cátedra
Unidad 4: Medidas de Tendencia Central y de Forma 43 Estadística - FHyCS
Preguntas ??
Estadística - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 44