probabelidad
DESCRIPTION
estadisticaTRANSCRIPT
1) ASIMETRÍAEs una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.1.1) TIPOS DE ASIMETRÍALa asimetría presenta las siguientes formas:Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su vez es menor que la moda,
en símbolos Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría.Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su
media aritmética, su mediana y su moda son iguales, en símbolos Md=MoAsimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda.También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda,
en símbolos
1.2) MEDIDAS DE ASIMETRÍACoeficiente de Karl Pearson
Donde:
= media aritmética.Md = Mediana.s = desviación típica o estándar.Nota:El Coeficiente de Pearson varía entre -3 y 3Si As < 0 ? la distribución será asimétrica negativa.Si As = 0 ? la distribución será simétrica.Si As > 0 ? la distribución será asimétrica positiva.Medida de Yule Bowley o Medida Cuartílica
Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.Nota:La Medida de Bowley varía entre -1 y 1Si As < 0 ? la distribución será asimétrica negativa.Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.Medida de FisherPara datos sin agrupar se emplea la siguiente fórmula:
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
Para datos agrupados en intervalos se emplea la siguiente fórmula:
Donde:
= cada uno de los valores; n = número de datos; = media aritmética; f = frecuencia absoluta
= cubo de la desviación estándar poblacional; xm = marca de claseNota:Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda de la media, aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica negativaSi As = 0 ? la distribución será simétricaSi As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de la media, aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica positivaEjemplo ilustrativo:Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisher dada la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17Solución:Calculando la media aritmética se obtiene:
Para calcular los cuartiles se ordena los datos de menor a mayor6 9 9 12 12 12 15 17
Calculando el cuartil uno se obtiene:
Calculando el cuartil dos se obtiene:
Calculando el cuartil tres se obtiene:
Calculando la desviación estándar muestral se obtiene:
Calculando el Coeficiente de Pearson se obtiene:
Calculando la Medida de Bowley se obtiene
Calculando la desviación estándar poblacional se obtiene:
Calculando la Medida de Fisher se obtiene
Datos
6 -166,375
9 -15,625
9 -15,625
12 0,125
12 0,125
12 0,125
15 42,875
17 166,375
Total 12
Los cálculos en Excel se muestran en la siguiente figura:
Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la Medida de Fisher
2) CURTOSIS O APUNTAMIENTOLa curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.2.1) TIPOS DE CURTOSISLa curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:Leptocúrtica.- Existe una gran concentración.Mesocúrtica.- Existe una concentración normal.Platicúrtica.- Existe una baja concentración.
2.2) MEDIDAS DE CURTOSISMedida de FisherPara datos sin agrupar se emplea la siguiente fórmula:
Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:
Para datos agrupados en intervalos se emplea la siguiente fórmula:
Donde: = cada uno de los valores; n = número de datos; = media aritmética; = Cuádruplo de la desviación estándar poblacional; f = frecuencia absoluta; xm = marca de claseNota:Si a < 3 ? la distribución es platicúticaSi a = 3 ? la distribución es normal o mesocúrticaSi a > 3 ? la distribución es leptocúrticaMedida basada en Cuartiles y Percentiles
(letra griega minúscula kappa) = Coeficiente percentil de curtosisNota:
Si < 0,263 ? la distribución es platicúrtica
Si = 0,263 ? la distribución es normal o mesocúrtica
Si > 0,263 ? la distribución es leptocúrticaEsta medida no es muy utilizada.Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.Solución: Calculando la media aritmética se obtiene
Calculando la desviación estándar poblacional se obtiene:
Calculando la Medida de Fisher se obtiene:
Datos
6 915,0625
9 39,0625
9 39,0625
12 0,0625
12 0,0625
12 0,0625
15 150,0625
17 915,0625
Total 2058,5
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17
Calculando el cuartil uno se obtiene:
Calculando el cuartil tres se obtiene:
Calculando el percentil 90 se tiene:
Calculando el percentil 10 se tiene:
Calculando el coeficiente percentil de curtosis se obtiene:
Como a= 2,23 y la distribución es platicúrticaLos cálculos en Excel se muestran en la siguiente figura:
Leer más: http://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-forma-asimetria-curtosis.shtml#ixzz473IfYOxv
++
Medidas de tendencia central: Media, Mediana, ModaSupóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificación del alumno se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 65 puntos, entonces la conclusión sería muy diferente, debido a que se ubicaría muy por debajo del promedio de la clase.
En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.
Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.
Las medidas de tendencia central más comunes son:
La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es afectada por los valores extremos).
La media es considerada como la mejor medida de tendencia central, por las siguientes razones:
Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media.
Es la medida de tendencia central más conocida y utilizada.
Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian.
La media se utiliza en procesos y técnicas estadísticas más complejas mientras que la mediana y la moda en muy pocos casos.
Cómo calcular, la media, la moda y la mediana
Media aritmética o promedio
El promedio de notas es muy importante.
La media, el mejor dato.
Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.
Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos)
La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.
Ejemplo 2:
Cuando se tienen muchos datos es más conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmética. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.
Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta
5 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54
Frecuencia total = 63
430
Se debe recordar que la frecuencia absoluta indica cuántas veces se repite cada valor, por lo tanto, la tabla es una manera más corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite más.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al número del caso que representa la mediana de la distribución.
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.
Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).
Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.
Ejemplo 2:
El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med será el promedio de los valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3
Ejemplo 3:
Interpretando el gráfico de barras podemos deducir que:
5 alumnos obtienen puntaje de 62
5 alumnos obtienen puntaje de 67
8 alumnos obtienen puntaje de 72
12 alumnos obtienen puntaje de 77
16 alumnos obtienen puntaje de 82
4 alumnos obtienen puntaje de 87
lo que hace un total de 50 alumnos
Sabemos que la mediana se obtiene haciendo
lo cual significa que la mediana se ubica en la posición intermedia entre los alumnos 25 y 26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:
puntaje alumnos
62 1
62 2
62 3
62 4
62 5
67 6
67 7
67 8
67 9
67 10
72 11
72 12
72 13
72 14
72 15
72 16
72 17
72 18
77 19
77 20
77 21
77 22
77 23
77 24
77 25
77 26
77 27
77 28
77 29
77 30
82 31
82 32
82 33
82 34
82 35
82 36
82 37
82 38
82 39
82 40
82 41
82 42
82 43
82 44
82 45
82 46
87 47
87 48
87 49
87 50
La medidas de centralización nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Moda
La moda es el valor que tiene mayor frecuencia
absoluta .
Se representa por Mo .
Se puede hallar la moda para variables
cualitativas y cuantitativas .
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal , es decir, t iene varias modas .
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia , no hay moda .
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes t ienen la frecuencia
máxima , la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
L i es el l ímite inferior de la clase modal.
f i es la frecuencia absoluta de la clase modal.
f i - - 1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.
f i -+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
a i es la amplitud de la clase.
También se uti l iza otra fórmula de la moda que da un valor aproximado de ésta:
Ejemplo
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
f i
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
2º Los intervalos tienen amplitudes distintas.
En primer lugar tenemos que hallar las alturas.
La clase modal es la que tiene mayor altura.
La fórmula de la moda aproximada cuando existen distintas amplitudes es:
Ejemplo
En la siguiente tabla se muestra las calif icaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda .
f i h i
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor .
La mediana se representa por Me .
La mediana se puede hallar sólo para variables
cuantitativas .
Cálculo de la mediana
1 Ordenamos los datos de menor a mayor .
2 Si la serie tiene un número impar de
medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones
la mediana es la media entre las dospuntuaciones
centrales .
7, 8, 9, 10, 11, 12Me= 9.5
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada l lega hasta la mitad de la suma
de las frecuencias absolutas .
Es decir tenemos que buscar el intervalo en el que se
encuentre .
L i es el l ímite inferior de la clase donde se encuentra la mediana.
es la semisuma de las frecuencias absolutas.
F i - 1 es la frecuencia acumulada anterior a la clase mediana.
a i es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos .
Ejemplo
Calcular la mediana de una distribución estadística que viene dada por la siguiente tabla:
f i F i
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100
100 / 2 = 50
Clase modal: [66, 69)
Media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre elnúmero total de datos .
es el símbolo de la media aritmética .
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
Ejercicio de media aritmética
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la
puntuación media .
x i f i x i · f i
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
Propiedades de la media aritmética
1 La suma de las desviaciones de todas las
puntuaciones de una distribución respecto a lamedia de la misma igual a cero .
Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
2 La media aritmética de los cuadrados de
las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética .
3 Si a todos los valores de la variable se les suma un
mismo número , la media aritmética quedaaumentada en dicho número .
4 Si todos los valores de la variable se multiplican por
un mismo número la media
aritméticaqueda multiplicada por dicho número .
Observaciones sobre la media aritmética
1 La media se puede hallar sólo para variables
cuantitativas .
2 La media es independiente de las amplitudes de
los intervalos .
3 La media es muy sensible a las puntuaciones
extremas . Si tenemos una distribución con los siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de
centralización poco representativa de la distribución.
4 La media no se puede calcular si hay un intervalo con
una amplitud indeterminada .
x i f i
[60, 63) 61.5 5
[63, 66) 64.5 18
[66, 69) 67.5 42
[69, 72) 70.5 27
[72, ∞ ) 8
100
En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último intervalo.