willianys estadistica

23
Media aritmética: En matemáticas y estadística, la media aritmética (también llamada promedio o simplemente media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muéstrales.

Upload: williannys2

Post on 07-Feb-2017

80 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: Willianys estadistica

Media aritmética:

En matemáticas y estadística, la media aritmética (también llamada promedio o simplemente media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muéstrales.

Page 2: Willianys estadistica

Se utiliza la letra X con una barra horizontal sobre el símbolo para representar la media de una muestra mientras que la letra µ (mu) se usa para la media aritmética de una población, es decir, el valor esperado de una variable.

En otras palabras, es la suma de n valores de la variable y luego dividido por n : donde n es el número de sumandos, o en el caso de estadística el número de datos se da el resultadoEjemplo: Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Page 3: Willianys estadistica

MedianaEn el ámbito de la estadística, la mediana (del latín mediānus 'del medio'1 ) representa el valor de la variable de posición central en un conjunto de datos ordenados.

Existen dos métodos para el cálculo de la mediana:

Considerando los datos en forma individual, sin agruparlos.Utilizando los datos agrupados en intervalos de clase.

A continuación veamos cada una de ellas:

Page 4: Willianys estadistica
Page 5: Willianys estadistica
Page 6: Willianys estadistica
Page 7: Willianys estadistica
Page 8: Willianys estadistica

MODA:En estadística, la moda es el valor con mayor frecuencia en una distribución de datos. Se hablará de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que hay moda.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

Page 9: Willianys estadistica
Page 10: Willianys estadistica
Page 11: Willianys estadistica

Medidas de posición

Percentiles (Centiles)

Se denomina Centil k o Percentil k la puntuación que deja por bajo el k por ciento de las puntuaciones de una distribución. Los Centiles son un caso particular de Cuantiles. Un Cuantil se define como una puntuación que deja por bajo una proporción conocida (k) de puntuaciones.

Principales características Las distancias entre Centiles, expresadas en términos de las puntuaciones directas,

NO son constantes, pero las áreas entre Centiles sí lo son.

En distribuciones simétricas, las distancias entre Centiles son menores en la parte central de la distribución que en los extremos.

Page 12: Willianys estadistica

UTILIDAD DE LOS PERCENTILES:

Uno de los usos más frecuentes que se le da al percentil es a la hora de satisfacer la necesidad de obtener datos concretos respecto de determinadas cuestiones que hacen al conocimiento más profundo de una sociedad o comunidad, por ejemplo, se quiere evaluar el crecimiento de los niños, entonces, los pediatras, basarán su evaluación justamente en tablas de percentiles para llevar a cabo la mencionada evaluación; se inspirarán entonces en tablas de percentiles diferentes según se trate de mujeres o de varones, con unos valores medios, según la edad y el país que corresponda. Las más usadas son las del peso, la altura y el perímetro craneal.

Page 13: Willianys estadistica

Cálculo Si se desea un resultado más preciso se puede utilizar la siguiente expresión: (datos agrupados en frecuencias):

Page 14: Willianys estadistica

Ejemplo Obtención de P60 (datos ya ordenados):

Page 15: Willianys estadistica

Medidas de dispersión:

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Page 16: Willianys estadistica
Page 17: Willianys estadistica
Page 18: Willianys estadistica
Page 19: Willianys estadistica
Page 20: Willianys estadistica
Page 21: Willianys estadistica
Page 22: Willianys estadistica

Utilidad de las Medidas de Dispersión:

Las medidas de dispersión son importantes debido a que dos muestras de observaciones con el mismo valor central pueden tener una variabilidad muy distinta. La variabilidad de cualquier distribución se contempla generalmente en términos de la desviación de cada valor observado (X) con respecto a la media muestral : X Si las desviaciones: (X − ) X son pequeñas, obviamente los datos son están menos dispersos, que si las desviaciones son grandes. La importancia de la DISPERSIÓN de la distribución esta basada en que:

1. Su información permite juzgar la confiabilidad de la medida de tendencia central. 2. Nos permite determinar cuan dispersos están lo datos y por lo tanto solucionar o explicar los problemas que se puedan presentar por este hecho. 3. Se pueden comparar las dispersiones de varias muestras, con la cual el riesgo de que exista un espectro de valores lejos del centro se puede evitar.