veter 5ta medidas posición relativa
Post on 15-Apr-2017
291 Views
Preview:
TRANSCRIPT
Dr. Mayhuasca Salgado RonaldDocente
Medidas de
posición relativa
ESTADÍSTICA2016-I
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA VETERINARIA
• Conocer y determinar las medidas de posición relativas como
las cuantilas: deciles, percentiles y cuartiles, de un conjunto
de datos dispersos o agrupados.
• Elaborar e interpretar el gráfico de caja y bigote de un conjunto
de datos
Propósito
Medidas de tendencia central
ESTADÍSTICA DESCRIPTIVA
Nos informan de los valores centrales hacia los que se dirige la distribución: media, mediana y moda
Medidas de posición
Nos localizan un dato determinado dentro de la serie, informándonos acerca de la propia distribución: mediana y percentiles
Medidas de dispersión
Nos informan de los valores centrales hacia los que se dirige la distribución: rango, desviación media, desviación típica, varianza y coeficiente de variación de Pearson
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y ep
idem
iolo
gia. Españ
a: Cu
rso
inten
sivo M
IR A
sturias; 2
01
1
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y ep
idem
iolo
gia. Españ
a: Cu
rso
inten
sivo M
IR A
sturias; 2
01
1
…Los percentiles son estadísticos de posición que dividen el número de observaciones de la distribución en partes porcentuales acumulativas…
Son llamados también de orden por que requieren un ordenamiento ascendente
Estadística Descriptiva
• Organización de datos• Representación de datos: Tablas y Gráficos• Medidas de resumen
• Medición de datos numéricos1. Medidas de tendencia central2. Medidas de dispersión3. Medidas de posición relativa4. Medidas de forma
• Medición de datos nominales1. Proporción2. Razón3. Medición epidemiológica
Son medidas útiles para comparar valores de diferentes
conjuntos de datos o dentro del mismo conjunto de
datos.
En estas medidas se incluyen a los cuartiles (Q) y
percentiles (p) que dividen al conjunto de datos que han
sido ordenados en proporciones diferentes.
Medidas de posición relativa
Es un valor en el recorrido de la variable en el que se acumula una
porción p de datos con medida máxima el valor de la cuantila, o
sea un porcentaje (px100) de datos, toma medidas menores o
iguales a Xp y el resto toma medidas mayores o iguales a Xp.
A las cuantilas se les denomina de manera particular según la
porción acumulada a la izquierda del punto.
- Decil: di
- Cuartil: qi
- Percentil: pi
- Mediana: Me=X0,50
Cuantiles o cuantila (Xp)
Cuartil (qi) q1=X0,25 ; q2=X0,50 ; q3= X0,75
Son puntos que dividen al conjunto de datos en 4 partes donde
cada uno acumula el 25% de datos, por ejemplo:
De los siguientes 60 datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,25
X0,50
X0,75
Cuartil (qi)
Interpretación: Indica que el 25% de las personas tienen hasta 24
años de edad, y que a lo más el 75% posee a lo más hasta 38
años, es decir el 50% tienen entre 24 y 38 años.
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
q1=X0,15 ; q2=X0,30 ; q3= X0,45 n=60
p1=X0,01 ; p2=X0,02 … p99= X0,99
Son puntos que dividen al conjunto de datos en 100 partes donde
cada uno acumula el 1% de datos, por ejemplo:
De los siguientes datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
Percentil (pi)
Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
65% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
p11=X0,11 = 21p32=X0,32 = 32p45= X0,45 = 38
Percentil (pi)
Percentil (pi)
Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
45% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
p11=X0,11 = 21p32=X0,32 = 32p45= X0,45 = 38
Percentil (pi)
“Px=y” significa que hay un “x” % de individuos
con menor o igual valor que “y”
“P80=30cm” significa que hay un “80” % de
individuos con menor o igual valor que “30”; o el
20% tienen más que 30cm
Cálculo de las cuantilas
𝑋𝑝 = 𝑋(𝑟)
• Si r no es entero redondear al entero superior
Donde:r = n x p
Luego de ordenas los datos ascendentemente se determina la cuantila p como el lugar que ocupa el lugar «r»
a. Para datos no agrupados
Sea la variable edad:
Varones:
𝑋0,50 = 31 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 30)
𝑋0,25 = 24 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 15)
𝑋0,75 = 38 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 45)
Cálculo de las cuantilas
La cuantila será al percentildeseado si:
Fj ≥ n* p
F j-1 ≤ n*p
Consideramos las fi y las Fi
b. Para datos agrupados por conteo individual
Ejemplo
De la siguiente tabla determine los percentiles 10, 25, , 50, 75, 90 y 05
Categorías f
0123456
48
111510133
Cálculo de las cuantilas
b. Para datos agrupados por conteo individual
De la siguiente tabla determine los percentiles 10, 25, 50, 75 y 95
Categorías f
0123456
48
111510133
P10 = 1 pues n*p = 64 x 0,10 = 6,4
P25 = 2 pues n*p = 64 x 0,25 = 16
P75 = 4 pues n*p = 64 x 0,75 = 48
P95 = 5 pues n*p = 64 x 0,95 = 60,8
Cálculo de las cuantilas
• Se determina el intervalo quecontiene a la cuantila Xpcomo el intervalo j:
Consideramos las fi y las Fi
c. Para datos agrupados en intervalos
Usamos la siguiente fórmula:
𝑋𝑝 = 𝐿𝑗𝑖 + 𝑐(𝑛 . 𝑝 − 𝐹𝑗−1)
𝑓𝑗
𝐹𝑗−1Frecuencia absoluta acumulada anterior a la clase cuantila j
𝐿𝑗𝑖
Frontera de la clase intervalo j (el puntomedio entre los extremos consecutivospara intervalos discretos) o límite inferiorpara intervalos continuos
Cálculo de las cuantilas
• Del siguiente cuadroobtengamos los percentiles,25, 50 y 75
Ejemplo
c. Para datos agrupados en intervalos
Edad fi
20-2930-3940-4950-5960-6970-79
56
10521
Cálculo de las cuantilas
c. Para datos agrupados en intervalos
Edad fi
20-2930-3940-4950-5960-6970-79
56
10521
𝑋25 = 29,5 + 10(29 ∗0,25 −5)
6= 33,5 años
𝑋50 = 39,5 + 10(29 ∗0,50 −11)
10= 43 años
𝑋75 = 49,5 + 10(29 ∗0,75 −21)
2= 53,25 años
Análisis exploratorio de datos
Es el proceso de usar herramientas estadísticas (sean gráficas,medidas de tendencia central y de dispersión) con la finalidad deobservar la disposición y otras características de uno o variosconjuntos de datos
Gráfico de caja y bigotes (box plot)
Son útiles para expresar la tendencia central de los datos, sudispersión, simetría y presencia de valores extremos
Para su construcción se requieren los valores mínimos y máximos,mediana, cuartil 1 y 3.
Permite la identificación e incorporación de valores atípicos
Q1 Q2 Q3Vm VM
Valores atípicos
Son datos que son distantes o numéricamente extremos del resto de los datos
Podrían distorsionar nuestras observaciones si no son tomados en cuentacomo tal.
Si en un análisis de los valores de creatinina de 15 pacientes, la mayoría deellos posee entre 0,8mg/dl y 1,05 mg/dl excepto uno de ellos que posee1,45mg/dl; tal vez su mediana es 0,97…pero su media será 1,28mg/dl
A valores extremos la mediana representa mejor la distribución de los datos
Tipos de valores atípicos
Al conocer los valores de Q1, Q3 y los rangos intercuartílicos sepueden hallar los siguientes valores atípicos:
Valores atípicos leves Valores atípicos extremos
𝑄1 − 1,5 𝑥 𝑅𝐼𝐶Min =
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶Max =
𝑄1 − 3 𝑥 𝑅𝐼𝐶Min =
𝑄3 + 3 𝑥 𝑅𝐼𝐶Max =
Rango intercuartílico
Es la diferencia entre el cuartil tres (Q3) y el cuartiluno (Q1), se representa por:
RIC= Q3 – Q1
Desviación intercuartil
Es una medida que acompaña a la mediana en ladescripción de datos:
𝑸𝟑 −𝑸𝟐
2
Generando el gráfico de caja y bigote
𝑄1 − 1,5 𝑥 𝑅𝐼𝐶
𝑀𝑒
𝑄3
Variable
𝑄1
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶
𝑄3 + 3 𝑥 𝑅𝐼𝐶
El percentil 90 de la talla de los recién nacidos de una determinada
población es 53cm. Esto quiere decir que:
1. El 90% de los recién nacidos miden más de 53cm.
2. El 10% de los recién nacidos miden más de 53 cm
3. El 90% de los recién nacidos miden 53cm
4. El 10% de los recién nacidos miden 5cm o más
5. El 90% de los recién nacidos miden 53cm o más
MIR 97
Ejemplo
• De la siguiente tabla sobre los pesos (en kg) de caprinos
mejorados, represente la información en un diagrama de caja
y bigotes
Tallo Hoja
131415161718
0, 1, 1, 2, 3, 5, 6, 81, 1, 1, 2, 2, 4, 6 ,7, 7, 90, 1, 2, 2, 3, 4, 5, 5, 6, 7, 7, 8, 92, 4, 4, 5, 6, 7, 80, 1, 2, 3, 3, 50, 2, 3
Conclusiones
• Los cuartiles, mediana y percentiles son las cuantilas de mayor uso para
la determinación de la posición y simetría de un conjunto de datos
• Los datos extremos pueden ser representados en la gráfica de caja y
bigotes
top related