03. medidas de dispersión
Post on 16-Nov-2015
78 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
BIOESTADSTICATatiana Burga.Wilver Rodrguez.
Medidas de Dispersin
-
Las medidas de dispersin o variabilidadSon tiles porque:Permiten juzgar la confiabilidad de la medida de tendencia central.Los datos demasiados dispersos tienen un comportamiento especial.Es posible comparar dispersin de diversas muestras.
-
AMPLITUD TOTAL: A RANGO: R Se obtiene de la diferencia entre el dato mayor y el dato menor.Ejemplo:Los siguientes datos representan los pesos de 10 pacientes. Calcule el rango.60, 58, 80, 70, 75, 55, 76, 60, 68, 70Amplitud Total Rango = 80 - 55 = 25InterpretacinLa diferencia entre el paciente con mayor peso y el paciente con menor peso es 25 kilos.
-
Clculo a partir de datos agrupadosSe utiliza la siguiente formula:
Amplitud Total o Rango = ( Ls - Li ) + 1 donde: Ls : Limite superior de la ltima clase : Limite inferior de la primera clase
-
Ejemplo: La distribucin de frecuencias siguiente representa las estancia hospitalaria(das) de una muestra de pacientes. Calcule e interprete el rango
Rango = (20 - 1) + 1
R = 20
Interpretacin: la diferencia de das entre el paciente que ms das hospitalarios y el paciente con menos das hospitalarios es de 20 das.
Hoja1
N DasN de Pacientes
1 - 44
5 - 88
9 - 1215
13 - 1623
17 - 2010
Total60
-
Ventajasfcil de calcularfcil de entender e interpretar
Desventajasslo considera los valores extremosno toma en cuenta ni el nmero de datos ni el valor de stosno es posible de calcular en tablas con extremos abiertos.
-
LA VARIANZAEs una medida de dispersin e indica la desviacin promedio con respecto a la media aritmticaa) Clculos a partir de datos no agrupados.para una muestra
para un poblacin
-
Ejemplo: La siguiente informacin se refiere a los das de hospitalizacin de 6 pacientes en un centro de salud: 8, 10, 5, 12, 10, 15. Calcule la varianza. Elaboramos un cuadro de la forma siguiente
Hoja1
88 - 10 = 24
1010 - 10 = 00
55 - 10 = 525
1212 - 10 = 24
1010 - 10 = 00
1515 - 10 = 525
-
LA DESVIACION ESTANDAREs la raz cuadrada de la varianza, sea poblacional o muestral.a) Clculos a partir de datos no agrupados
Para la muestra
Para la poblacin
-
Ejemplo: En relacin al ejemplo anterior. Calcular la desviacin estndar de los siguientes das hospitalarios: 8, 10, 5, 12, 10, 15Ya sabemos por el ejemplo anterior que S2 = 11,6 das2. Entonces:
-
DESVIACIN ESTANDARDonde: fi: frecuencias absolutas simples Xi: puntos medios de los intervalos de clase
-
Ejemplo: Calcular la desviacin estndar de la siguiente distribucin de frecuencias:
N de Das HospitalariosXifiXi*fiXi2*fi2 - 43412365 - 7610603608 - 10915135121511 - 131230360432014 - 1615575112517 - 1918118324Total656607380
-
DESVIACIN ESTANDAR
-
-3 -2 - + +2 +3
68.3 %
95.5 %99.7 %
Teorema de Chebyshev
-
El coeficiente de variacinEs una medida de variabilidad relativa de los datos, permite comparar la variabilidad de dos o ms conjuntos de datos expresados en unidades diferentes (peso; kg. y libras).
a) Calculos a partir de datos no agrupados
Para la muestra:
Para la poblacin:
-
Ejemplo: A continuacin se presentan los pesos en dos grupos de pacientes Cul de los grupos tiene un peso ms estable?.
I grupo II grupo40,70,60,48,52,65,58 70,35,150,140,82,110,140,120
Calculamos la media y desviacin estndar para cada uno de los grados
-
Grupo I
Hoja1
40-16.14260.50
7013.86192.10
603.8614.90
48-8.1466.26
52-4.1417.14
658.8678.50
581.863.46
-
Grupo II
Hoja1
105.87
70-35.871286.6569
35-70.875022.5569
15044.131947.4569
14034.131164.8569
82-23.87569.7769
1104.1317.0569
14034.131164.8569
12014.13199.6569
-
El II grupo presenta una mayor variabilidad en sus pesos que el I grupo.
-
CONSIDERACIONESSI:C.V 33% La distribucin se puede considerar aproximadamente simtrica.C.V 33% La distribucin puede ser asimtrica
*
-
Curvas simtricas: Cuando al trazar una lnea el rea se divide en dos partes iguales. Curvas asimtricas o sesgadas: Concentrados en el extremo inferior o superior del eje horizontal. La cola indica el tipo de sesgo.Medidas Forma:
-
X=Me=Mo
Mo
-
Refleja el grado de agudeza. (a) Leptocrtica (concentracin al centro) (b) Mesocrtica (distribuidos simtricamente) (c) Platicrtica (aplanada).Coeficiente de Curtosis
-
USO DE LAS DIFERENTES MEDIDAS DE DISPERSIONLa desviacin estndar se emplea cuando tambin es apropiado el uso de la media, es decir, con distribuciones simtricas(no sesgadas) de datos numricos.Percentiles y rango intercuartilicos se emplean, cuando la distribucin no es simtrica(sesgada) y es apropiado el uso de la mediana.
-
USO DE LAS DIFERENTES MEDIDAS DE DISPERSIONEl rango es una medida apropiada para datos numricos cuando el propsito es enfatizar valores extremos.El coeficiente de variacin es til cuando la intencin es comparar dos distribuciones numricas medidas en escalas diferentes.
-
El Boxplot (Diagrama de Caja)Al igual que el histograma y el grfico de Tallo y Hoja permite tener una idea visual de la distribucin de los datos (simetra y variabilidad)Permite detectar outliers (valores extremos).Permite comparar la media y la variabilidad de varios grupos (alternativa grfica a pruebas estadsticas)
-
Boxplot: ProcedimientoDibujar una caja cuyo lmite inferior ser Q1 y el superior Q3. Dentro de la caja trazar una lnea que localice la mediana.Calcular el rango intercuartlico: R.I. (Q) = RIQ = Q3 Q1Dibujar un bigote del borde inferior de la caja hasta Q1-1.5xRIQ .
-
Boxplot: ProcedimientoDibujar otrobigote del borde superior de la caja hasta Q3+1.5xRIQ .Dibujar cualquier observacin que se ubique fueras de los bigotes (estos sern los outliers).
-
BoxPlot: Ejemplo
49.bin
-
OTRA ALTERNATIVA DE ANALIZAR LA DISPERSIN DE UN CONJUNTO DE DATOS: GRFICO DE TALLO - HOJAS
-
Grfico de Tallo - HojaUn diagrama de tallos y hojas consiste en una serie de hileras horizontales de nmeros. El nmero utilizado para designar una hilera es un tallo y el resto de nmeros en la hilera se denominan hojas.
-
Se tienen los siguientes datos permetro ceflico (cm) de recin nacidos, que constituye una muestra obtenida de una poblacin de recin nacidos:
33.133.433.633.733.733.833.934.034.134.234.234.234.234.234.334.334.534.534.634.634.634.734.734.834.935.135.135.235.235.335.635.836.036.136.5
-
Para la clasificacin de datos, se deben identificar los valores entre los cuales se encuentra la distribucin, es decir, el dato menor y el dato mayor.
Dato menor: 33.1cmDato mayor: 36.5cm
33.133.433.633.733.733.833.934.034.134.234.234.234.234.234.334.334.534.534.634.634.634.734.734.834.935.135.135.235.235.335.635.836.036.136.5
-
Se deben identificar los tallos -los nmeros que van a designar las hileras- los cuales deben contener a todos los valores de la distribucin (del 33.1 al 36.5). La eleccin de los tallos depende de la unidad con la que se quiera trabajar: enteros, dcimas, centsimas... En el caso del ejemplo, los datos estn dados indicando dcimas por lo que trabajar con tallos enteros es la opcin ms precisa y cmoda. Los tallos seran entonces: 33, 34, 35 y 36.
-
Sin embargo, no se puede realizar un diagrama de tallos y hojas con menos de 5 tallos. Por lo tanto, los tallos propuestos se deben dividir (desdoblar) en una especie de intervalo, produciendo el doble. La divisin del tallo debe distinguirse visualmente:
33.133.433.633.733.733.833.934.034.134.234.234.234.234.234.334.334.534.534.634.634.634.734.734.834.935.135.135.235.235.335.635.836.036.136.5
-
Seguidamente, se realiza el proceso de clasificacin en s. Todos los datos, dependiendo de su valor, se colocan a lado de su respectivo tallo. En el ejemplo, los datos cuyo valor se encuentre entre 33.0 y 33.4 se deben colocar en la hilera del tallo 33*. Se debe indicar el valor decimal exacto de cada dato a la derecha del tallo. En el ejemplo hay 2 valores entre 33.0 y 33.4. Para clasificar el primero (33.1) se agrega al diagrama de tallos y hojas de la siguiente manera:33*1Para clasificar el segundo dato que corresponde a este tallo (33.4):33*14
-
Lo mismo se realiza con cada tallo y lo valores que le correspondan: En la hilera del tallo 33. se debe colocar los nmeros 67789, correspondientes a los valores 33.6, 33.7, 33.7, 33.8, 33.8 y 33.9.A la hilera del tallo 34* se debe colocar 012222233 correspondientes a los valores que se encuentran entre 34.0 y 34.4.etc.
-
Al clasificar todos los valores en sus tallos respectivos, se obtiene el diagrama:
-
Anlisis de la distribucin usando Tallos y HojasLas principales caractersticas de la distribucin que se observan fcilmente en el diagrama de tallos y hojas son:Hay 35 observaciones.El dato menor es 33.1cm.El dato mayor es 36.5cm.El rango de los valores observados es de 3.4cm (dato mayor dato menor).De los 35 datos, 18 estn alrededor de 34cm.Los casos mayores a 36cm son pocos.La distribucin de los datos es asimtrica: distribucin heterognea.
*
top related