universidad nacional hermilio valdizan facultad de … · 2020. 11. 30. · medidas para describir...
Post on 31-Jan-2021
6 Views
Preview:
TRANSCRIPT
-
BIOESTADÍSTICA
Dr. Abner A. Fonseca Livias
PROFESOR PRINCIPAL
UNIVERSIDAD NACIONAL HERMILIO VALDIZAN
FACULTAD DE ENFERMERÍA
-
MEDIDAS PARA DESCRIBIR
VARIABLES NUMÉRICAS
Dr. Abner A. Fonseca Livias
PROFESOR PRINCIPAL
UNIVERSIDAD NACIONAL HERMILIO VALDIZAN
FACULTAD DE ENFERMERÍA
-
MEDIDAS
• Medidas de tendencia central
• Medidas de dispersión
• Medidas de percentiles o posicionamiento
• Medidas de distribución o de forma
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 3
1 ESTADISTICA PRIMER PARCIAL.ppt#130. MEDIDAS DE TENDENCIA CENTRAL1 ESTADISTICA PRIMER PARCIAL.ppt#162. DESCRIPCIÓN DE UNA VARIABLE NUMÉRICA1 ESTADISTICA PRIMER PARCIAL.ppt#178. MEDIDAS DE POSICIÓN O CUANTILES1 ESTADISTICA PRIMER PARCIAL.ppt#191. Coeficiente de Asimetría
-
MEDIDAS DE TENDENCIA CENTRAL
• Media aritmética
• Mediana
• Moda
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 4
-
MEDIA ARITMÉTICA
• Es la que se obtiene sumando los datos y dividiéndolos
por el número de ellos.
– Características:
• No es para distribuciones cualitativas.
• Esta afectada por todos los valores que asume la
variable.
• Si presenta valores extremos bajos o altos, se
recomienda usar otra medida de tendencia central.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 5
-
MEDIA ARITMÉTICA
• La fórmula que se emplea depende si se trabaja
con N o n.
• La media aritmética es útil con datos no agrupados
y agrupados.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 6
1
N
i
i
x
N ==
n
i
i
x
xn
=
Media de la
poblaciónMedia de la
Muestra
-
MEDIA ARITMÉTICA PARA DATOS
NO AGRUPADOS
• Los datos no agrupados no están en tabla de frecuencia.
• Ejemplo: El profesor de estadística desea conocer el
promedio de las siguientes notas:
3,2 3,1 2,4 4,0 3,5 3,0 3,5 3,8 4,2 4,0
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 7
-
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS
• Es para datos agrupados en tablas, la media aritmética
es igual a la sumatoria del producto de las clases por
la frecuencia sobre el número de datos. Se puede
calcular de la N o n.
• También se trabaja con marca de clase (Mc) por
frecuencia y se divide por el número de datos.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 8
-
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS EN FRECUENCIA
Preguntas
buenas
Frecuencia
1 15
2 13
3 8
4 19
5 21
6 5
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 9
Pasos:
1. Realizar sumatoria del producto de las
clases por su frecuencia absoluta.
2. Dividir la sumatoria sobre el número total de datos.
-
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS EN MARCA DE CLASE
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 10
Pasos:
1. Realizar sumatoria del producto
de la marca de clase (Mc) por su
frecuencia absoluta.
-
MEDIA ARITMÉTICA PARA DATOS
AGRUPADOS EN MARCA DE CLASE
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 11
2. Dividir la sumatoria sobre el número total de datos.
-
VENTAJAS Y DESVENTAJAS DE LA
MEDIA
Ventajas
• Es la medida de tendencia central más usada.
• El promedio es estable en el muestreo.
• Es sensible a cualquier cambio en los datos (puede ser
usado como un detector de variaciones en los datos).
• Se emplea a menudo en cálculos estadísticos
posteriores.
• Presenta rigor matemático.
• En la gráfica de frecuencia representa el centro de
gravedad.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 12
-
VENTAJAS Y DESVENTAJAS DE LA
MEDIA
Desventajas
• Es sensible a los valores extremos.
• No es recomendable emplearla en distribuciones muy
asimétricas.
• Si se emplean variables discretas o cuasi-cualitativas, la
media aritmética puede no pertenecer al conjunto de
valores de la variable.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 13
-
CÁLCULO DE MEDIA
ARITMÉTICA EN EXCEL Y SPSS• Trabajar con la base de datos que se
tiene.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 14
-
MEDIANA (Me)
• La mediana divide a la población exactamente en dos
partes iguales. La cantidad de datos que queda por
debajo y por arriba de la mediana son iguales.
Corresponde al percentil 50%.
Se puede calcular Me para:
• Datos no agrupados:
– Impares
– Pares
• Datos agrupados
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 15
-
MEDIANA PARA DATOS NO
AGRUPADOS IMPARES
Encontrar la mediana para los siguientes datos:
4 1 2 3 4 2 2 1 5 5 3
SOLUCIÓN:
• PASO 1: Ordenar los datos.
1 1 2 2 2 3 3 4 4 5 5
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 16
-
MEDIANA PARA DATOS NO
AGRUPADOS IMPARES
• PASO 2: Localizar el valor que divide en dos partes
iguales el número de datos.
• La mediana es 3, dejando 5 datos a cada lado.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 17
-
MEDIANA PARA DATOS NO
AGRUPADOS PARES
• Modifiquemos el ejemplo anterior, eliminando el
último dato. Encontrar la mediana:
4 1 2 3 4 2 2 1 5 5
SOLUCIÓN
• PASO 1: Ordenar los datos.
1 1 2 2 2 3 4 4 5 5
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 18
-
MEDIANA PARA DATOS NO
AGRUPADOS PARES
• PASO 2: Localizar el valor que divide en dos parte
iguales el número de datos.
• El punto medio se encuentra entre dos valores: 2 y
3, por tanto, el valor de la mediana será 2,5.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 19
-
MEDIANA PARA DATOS
AGRUPADOS• Calcular la mediana a partir de frecuencia
relativa acumulada (H) en la siguiente
tabla de frecuencia:
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 20
-
MEDIANA PARA DATOS
AGRUPADOS• PASO 1: Localizar la frecuencia relativa acumulada
que contiene la mediana (50%).
• La Me se encuentra entre las clases 3 y 4.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 21
-
MEDIANA PARA DATOS
AGRUPADOS• PASO 2: Interpolar los datos para encontrar la Me.
• Se ordena según la jerarquía de los datos de H
(mayor a menor) lo cual incluye a las clases, para
encontrar el punto que divide en 2 partes iguales.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 22
-
MEDIANA PARA DATOS
AGRUPADOS• La diferencia es 27,1%. Para llegar al 50%, se debe
incrementar en 4,2% partiendo desde la clase 30.
45,8%+ 4,2% = 50,0%
• Con una regla de tres simples se halla el incremento
en unidades la clase para ese 4,2%.
10 27,1%
Incremento 4,2 %
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 23
-
MEDIANA PARA DATOS
AGRUPADOS• Para llegar al 50% de los datos, a la clase
30 debemos incrementarle 1,55.
Me = 31,55
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 24
-
MEDIANA PARA DATOS
AGRUPADOS• Calcular la mediana a partir de intervalos de clase
para datos agrupados en la siguiente tabla.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 25
-
MEDIANA PARA DATOS
AGRUPADOS• PASO 1: Localizar entre qué intervalos de clase se
encuentra la Me, lo cual está entre el intervalo de clase
4, para ser más preciso, entre los valores 45,21 y 53,21.
• Hasta 45,21 hay agrupados el 42,50% de los datos, y
hasta 53,21 se resume el 60,00% de los datos.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 26
-
MEDIANA PARA DATOS
AGRUPADOS• PASO 2: Interpolar los datos para encontrar la
mediana. Se ordena jerárquicamente:
• Entre los dos límites superiores abarcan un total de
17,50% de los datos. Se debe aumentar en 7,50%
los datos desde límite superior del tercer intervalo
de clase.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 27
-
MEDIANA PARA DATOS
AGRUPADOSPara incrementar al 50%, se determina la diferencia
(42,5 + 7,5) y se procede:
8,00 17,50%
Incremento 7,50%
• Para llegar al 50% de los datos, 45,21 se aumenta
en 3,43 unidades.
Me = 45,21+ 3,43 Me = 48,6430/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 28
-
MEDIANA PARA DATOS
AGRUPADOS
La fórmula para calcular la mediana
• La mediana parte del límite superior del intervalo
de clase anterior, la cual simbolizaremos por Lsi-1,
siendo i igual a 4 (cuarto intervalo de clase). A este
valor se le suma el incremento para llegar al 50%
de los datos:
• Me = Ls i-1 + Incremento
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 29
-
MEDIANA PARA DATOS
AGRUPADOS• El incremento resulta de multiplicar el incremento para
llevar la frecuencia al 50% (50% - Hi-1) por el ancho de
la clase (A) sobre la diferencia porcentual entre los
límites superiores (Hi – Hi-1):
• Simplificando aún más la fórmula, recordemos que Hi –
Hi-1 es lo mismo la frecuencia relativa del intervalo de
clase i (hi).
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 30
-
MODA
• Valor que aparece con mayor frecuencia. Una
distribución unimodal tiene una sola moda y una
distribución bimodal tiene dos.
Ejemplo: moda para datos no agrupados
• Los siguientes 30 datos a personas sobre la marca de
gaseosa que más consume a la semana:
Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3
Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1
Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1
Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2
Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3
•30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 31
-
MODA
SOLUCIÓN
• PASO 1: Determinar las frecuencias de cada valor
de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces
• PASO 2: la moda representa el valor que más se
repite. En este caso es la marca 1.
Mo = Marca 1
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 32
-
MODA
• Ejemplo: moda para datos agrupados
• Calcular la moda a partir de la siguiente
tabla de frecuencia:
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 33
-
MODA
SOLUCIÓN
• Las marcas de clase que más frecuencias
tienen son 11 y 13, por tanto decimos que
es un caso donde aparecen dos modas
(bimodal).
Mo1 = 11
Mo2 = 13
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 34
-
MODA
Calculo de la moda mediante fórmula
• Algunos autores suelen aplicar una
fórmula para determinar la moda para
tablas de frecuencia.
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 35
-
DESCRIPCIÓN DE UNA VARIABLE
NUMÉRICA
MEDIDAS DE DISPERSIÓN
• Desviación Estándar
• La varianza.
• Coeficiente de variación
30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 36
-
DESVIACIÓN ESTÁNDAR (S)
• Es el promedio de distancias que tienen los datos
respecto a la media aritmética. Llamada también
desviación típica.
• La fórmula para datos no agrupados es:
Donde:
• = sumatoria del cuadrado de las desviaciones.
• n / N = muestra o población30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 37
1
X(
S 1
2
2)
s −
−
==
=
n
n
i
xi
1
X(
1
2
2)
−
−
==
=
N
N
i
i
Para la población
)X(2
xi − )X(2
−i
Para la muestra
-
DESVIACIÓN ESTÁNDAR (S)
• Ejemplo:
• Desviación estándar: 1.9730/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 38
X X- (X- )29 3.29 10.807 1.29 1.656 0.29 0.086 0.29 0.085 -0.71 0.514 -1.71 2.943 -2.71 7.37
Media ( ) 5.71428571 23.43
1
X(
S 1
2
)
−
−
=
=
n
n
i
xi
17
23.40
S 1
−=
=
n
i
9.3S =
top related