clases estadistica 1 unid
TRANSCRIPT
Diapositiva 1
ESTADSTICA
Mg.C.D. ARMANDO CARRILLO FERNNDEZ
25/02/2013AMCF
1ytytkyutyu
25/02/2013AMCF
25/02/2013AMCF
25/02/2013AMCF
INTRODUCCION A LA ESTADSTICA
PRIMERA SEMANA
25/02/2013AMCF
5ytytkyutyu
DEFINICIONES
DATOS
ESTADISTICA: # estadistico: muestra
POBLACIN
CENSO
MUESTRA
PARAMETRO. Medicin numrica que describe algunas caractersticas de una poblacin25/02/2013AMCF
PARAMETRO De los 1324 semforos de Huancayo Distrito estn funcionando a la fecha 890.
25/02/2013AMCF
Estadstico Una muestra de 300 trabajadores , se encontr que el 80 % est satisfecho con su salario.
Los datos muestrales deben reunirse de forma adecuada: 25/02/2013AMCF
25/02/2013AMCF
25/02/2013AMCF
TIPOS DE DATOS25/02/2013AMCFLos datos muestrales sirven para hacer INFERENCIAS sobre una POBLACION COMPLETA.
DATOS CUANTITATIVOS : peso,talla,etcDATOS CUALITATIVOS :gnero
Conocer y diferenciar la naturaleza de los datos muestrales, ya que su mal aplicacin afectan de manera importante los mtodos y resultados
25/02/2013AMCF
MarsOrbiterClimate
Datos cuantitativos
Datos discretos cuando es un NMERO FINITO
Datos continuos (numricos) resultan de un infinito de posibles valores.25/02/2013AMCF
25/02/2013AMCFOTRA CLASIFICACION DE LOS DATOSNOMINALORDINALINTERVALO RAZN
25/02/2013AMCFNOMINAL: Son exclusivamente en nombre,etiquetas o categoras. No se pueden ordenar.
EJEMPLO:Si-no-indecisoColores
25/02/2013AMCFORDINAL: Cuando se pueden colocar en algn orden, para obtener comparaciones relativas, aunque no es posible determinar diferencias de magnitud.
EJEMPLO:Calificaciones del curso: ABCDERango
25/02/2013AMCFINTERVALO: Parecido al ordinal, pero la diferencia entre los datos tiene un significado. No tienen un punto de partida cero natural inherente.
EJEMPLO:TemperaturaAos
25/02/2013AMCFRAZON: Parecido al intervalo, la diferencia entre los datos tiene un significado. Tienen un punto de partida cero natural inherente.
EJEMPLO:PesoPrecio
Qu es lo que hemos visto?
25/02/2013AMCF
ACTIVIDADES PAGINAS 11 Y 12
Entrega prxima clase de teora
VARIABLES
SEGUNDA SEMANA
25/02/2013AMCF
22ytytkyutyu
25/02/2013AMCFCONCEPTO
Es cualquier caracterstica, cualidad o propiedad de un fenmeno o hecho que tiende a variar y que es susceptible de ser modificado o evaluado
25/02/2013AMCFTambin se puede definir como una propiedad que adquiere varios valores.Por ejemplo, la edad,sexo,religin,etc.
25/02/2013AMCFForman la estructura del problema de investigacin ya que la relacin que vamos a investigar es la relacin entre variables
25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 1.- CUALITATIVAS. Son aquellas cuyos elementos de variacin tienen un carcter cualitativo. No se pueden medir mediante nmeros,sin utilizar la frecuencia en que aparecen,es decir se expresan verbalmente con un cdigo prestablecido,no llevan clasificacin numrica y se expresan en atributos o categoras de clasificacin.
Ejemplo: Sexo,estado civil,caractersticas de la personalidad
25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 1.- CUALITATIVAS.
a) NOMINALES. Cuando la categora de clasificacin o atributo no tiene ningn orden. Ejemplo. Sexo, estado civil, color cabello
25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 1.- CUALITATIVAS.
a) ORDINALES. Cuando la categora de clasificacin o atributo poseen una ordenacin natural. Ejemplo. Estatus socioeconmico, medidas de las camisas, niveles de estudio.
NATURALEZA: 2.- CUANTITATIVAS. Son aquellas cuyos elementos de variacin tienen un carcter cuantitativo o numrico. Ejemplo. Rendimiento escolar,nivel de ingreso econmico,edad.
25/02/2013AMCFCLASIFICACION DE LAS VARIABLES
25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 2.- CUANTITATIVAS. a) Discretas. Cuando estn restringidas a determinado valor.Son tambin llamadas categricas.Ejemplo. N de hijos, ctdad de trabajadores que reciben un sueldo por encima de X soles
25/02/2013AMCFCLASIFICACION DE LAS VARIABLESNATURALEZA: 2.- CUANTITATIVAS. b) Continuas.Son aquellas que pueden tomar cualquier valor numricoEjemplo. Rendimiento intelectual, temperatura ambiental , etc.
25/02/2013AMCFCLASIFICACION DE LAS VARIABLESB) DE ACUERDO AL LUGAR O IMPORTANCIA DENTRO DE UNA RELACIN DE VARIABLES Se clasifican en variables independientes,dependientes y extraa o intermitente
Ejemplo: Estudio sobre el efecto de un programa de aprestamiento perceptivo-motor en el aprendizaje de la lecto escritura
25/02/2013AMCFINDICADORESSon los instrumentos para medir a la variable, es necesario tomarlos en cuenta para construir los instrumentos de recoleccin de datos.
25/02/2013AMCF
Variable estadstica (v.e.): Caracterstica propia del individuo objeto del estudio estadstico
Modalidad: Cada una de las posibilidades o estados diferentes de una variable estadstica Exhaustivas e incompatibles Variables estadsticas. ModalidadesEjemplos:- Estatura- Salario- Color del pelo- Nivel de colesterol- N de hijos de una familia
Ejemplo: color del pelo:- castao- rubio- negro
36 Cualitativas: Las caractersticas no son cuantificables Cuantitativas: Caractersticas cuantificables o numricas Discretas: Numricas numerables Continuas: Numricas no numerables Tipos de variables estadsticasEjemplos: Grupo sanguineo Profesin Color del pelo
Ejemplos: N de hijos de una familia N de nidos de procesionarias por rbol N de virus en un cultivo
Ejemplos: Estatura Salario Nivel de colesterol
RESUMEN DE DATOS
TERCERA SEMANA
25/02/2013AMCF
37ytytkyutyu
25/02/2013AMCFORGANIZARRESUMIRGRAFICAR DATOS
SABER ENTENDER E INTERPRETAR LOS DATOS
25/02/2013AMCFCARACTERISTICAS IMPORTANTES DELOS DATOS1.- CENTRO.2.-VARIACIN.3.- DISTRIBUCIN: ( campana,uniforme,sesgada)4.- VALORES EXTREMOS5.- TIEMPO: caractersticas cambiantes de los datos
25/02/2013AMCFDISTRIBUCIONES DE FRECUENCIALa empleamos cuando trabajamos con grandes conjuntos de datos, con el fin de organizarlos y resumirlos y entenderlos lo que nos dicen.(su naturaleza)
25/02/2013AMCFDEFINICINSon las listas de valores (individuales o intervalos), junto a sus frecuencias (conteos) respectivos.Distribucin de frecuencia: Edades de las mejores actricesEdad de las actricesFRECUENCIAS21-302831-403041-501251-60261-70271-802
25/02/2013AMCFDEFINICIONES1.- LIMITE CLASE INFERIOR 2.-LIMITE DE CLASE SUPERIOR3.- FRONTERAS DE CLASE til para elaborar histogramas4.- MARCAS DE CLASE (Ci + Cs) / 25.- ANCHURA DE CLASE Diferencia entre Ci consecutivas
25/02/2013AMCFProcedimientos para construir una distribucin de frecuenciasSeleccionar las clases2.- Anchura de clase= valor ms alto valor ms bajo ------------------------------------------ nmero de clases = 9,833 = 103.- Partida 214.- Ci 31,41,51,61,71.5.- Cs 30,40,50,60,70,80
25/02/2013AMCFProcedimientos para construir una distribucin de frecuencias relativasDividir cada frecuencia de clase entre el total de frecuencias, se expresan en porcentajes2.- Frecuencia relativa= frecuencia de la clase ------------------------------------------ suma de todas las frecuencias
25/02/2013AMCFDistribucin de frecuencia relativas de las edades de las mejores actricesEdad de las actricesFRECUENCIAS21-3037%31-4039%41-5016%51-603%61-703%71-803%
La suma de las frecuencias relativas debe sumar 1 o 100%,con discrepancias por el redondeo
25/02/2013AMCFDistribucin de frecuencias acumulativas
Es la suma de las frecuencias para es clase y todas las clases anteriores28+30 = 582.- 28+30+12=703.- 28+30+12+2=724.- 28+30+12+2+2= 745.- 28+30+12+2+2+2= 76
25/02/2013AMCFDistribucin de frecuencia acumuladas de las edades de las mejores actricesEdad de las actricesFRECUENCIASMenor de 3128Menor de 4158Menor de 5170Menor de 6172Menor de 7174Menor de 8176
Los lmites de clase son reemplazados por la expresin menor que
Qu es lo que hemos visto?
25/02/2013AMCFDISTRIBUCIN NORMALAl graficarlas tienen forma de CAMPANA
Al inicio las frecuencias son bajas, despus se incrementan hasta un punto mximo, luego descienden
Deben ser simtricas y las frecuencias se distribuyen de manera uniforme a ambos lados de la frecuencia mxima
25/02/2013AMCFEJERCICIO PRACTICOLAS NOTAS DEL CURSO DE ESTADSTICA DEL CICLO PASADO HAN SIDO LAS SIGUIENTES:
3,4,1,2,8,9,8,7,6,6,7,9,8,7,7,1,0,1,5,9,9,8,0,8,8,8,9,5,7,5,
25/02/2013AMCFnotasfrecuencia absolutafrecuencia absoluta acumuladaporcentajePorcentaje acumulado
25/02/2013AMCFInterpretacin de los datos
25/02/2013AMCFFRECUENCIA DE DATOS AGRUPADOS EN INTERVALOS DE CLASERecorrido o rango. Se usa para variables cuantitativas, es la diferencia entre el mayor y menor valor de los datos
25/02/2013AMCFDeterminacin del nmero de intervalos de clase (k)Consiste en dividir el rango en un nmero conveniente de intervalos.
Si n menor igual que 100 k= raz cuadrada de n
Si n mayor que 100 k= 1+ 3,32193 * log 10 n
25/02/2013AMCFFRECUENCIA DE DATOS AGRUPADOS EN INTERVALOS DE CLASE8.36.67.57.98.27.88.57.97.98.57.26.68.86.68.37.77.97.88.49.36.67.67.58.67.97.47.97.87.997.47.57.7.17.77.38.58.26.67.56.77.76.76.68.46.87.987.898.78.78.26.78.37.37.96.78.59.199.38.46.67.26.67.27.57.99.8108.77.29.67.48.57.97.88.58.5
25/02/2013AMCFK= 80 = 8.9= 9 son los intervalos a trabajar
Rango = 10- 6,6 = 3,4
Amplitud de clase 3,4/ 9 = 0,4
25/02/2013AMCF
ACTIVIDADES completar el cuadro de la presentacin (diapositiva) 28
Entrega prxima clase de teora
GRFICOS DE DATOS
CUARTA SEMANA
25/02/2013AMCF
58ytytkyutyu
25/02/2013AMCFHISTOGRAMASGrficas que describen la naturaleza de la distribucin
Qu es? Es una grfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencias.La altura corresponde a las frecuencias
25/02/2013AMCFHISTOGRAMAS DE FRECUENCIAS RELATIVASLa escala vertical representa frecuencias RELATIVAS EN LUGAR DE LAS FRECUENCIAS REALES
25/02/2013AMCF
25/02/2013AMCFGRFICAS ESTADSTICAS1.- Polgonos de frecuencia utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de marcas de clase
25/02/2013AMCFGRFICAS ESTADSTICAS2.- Ojivas grfica lineal que representa frecuencias acumulativas
25/02/2013AMCFGRFICAS ESTADSTICAS3.- Puntos es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores
25/02/2013AMCFGRFICAS ESTADSTICAS4.- Grficas de Pareto es para datos cualitativos
25/02/2013AMCFGRFICAS ESTADSTICAS5.- Grficas circulares Tambin datos cualitativos
25/02/2013AMCFGRFICAS ESTADSTICAS6.- Dispersin datos apareados (x,y)
Qu es lo que hemos visto?
69
Variables continuas: IntervalosIntervalo I ix in iNifiFi e0 e1 ... e i-1 ei ... e k -1 ekx1...x i...xkn1...n i...n kN1...Ni...N kf1...fi...fkF1...Fi...Fkn1
Marca de clase xi (punto medio de cada intervalo) Amplitud ai (distancia entre los extremos) Intervalos cerrados por un extremo y abiertos por otro
70 V. E. Cualitativas: Grfico rectangular2010
NegroGrisBlancoRojoVioleta Grficos estadsticosColor PlumajeN de Aves ( n i ) Negro10Gris14Blanco20Rojo6Violeta454
71 V. E. Cualitativas: Grfico de sectores
rojovioletanegrogrisblancoColor PlumajeN de Avesn i f iGradosNegro100,18566,6Gris140,25993,24Blanco200,37133,2Rojo 60,11139,96Violeta 40,07426,6454
Grados de un sector = 360 0 x fi
72
V. E. Discretas: Grfico de barrasN de crasN animales: n if iFi2200.200.203300.300.504250.250.755150.150.906100.101n = 100
73Estaturan ih i = n i / a i140 160301.5160 170222.2170 180202180 190181.8190 200101100
V. E. Continuas: Histograma
El rea de cada rectngulo es proporcional a la frecuencia
11,51,8
140160170180200
hi
190
2.2
2
25/02/2013AMCF
ACTIVIDADES pgina 25-26 de la pregunta1 a la 3
Entrega prxima clase de teora
ESTADSTICA PARA DESCRIBIR,EXPLORAR Y COMPARAR DATOS
QUINTA SEMANA
25/02/2013AMCF
75ytytkyutyu
25/02/2013AMCFMEDIDAS DE TENDENCIA CENTRALCaracteristicas del CENTRO, buscamos obtener un nmero que represente el valor central de un conjunto de datos.
Existen formas de encontrarlo, entre ellas tenemos LA MEDIA, MEDIANA,MODA Y MITAD DE RANGO
25/02/2013AMCFMEDIAEs la ms importante que se emplea para describir datos, comnmente se le conoce como el promedio.
Se obtiene al sumar los valores y dividirlos entre el nmero de valores.
Su desventaja es su sensibilidad a cada valor, cuando son puntuaciones excepcionales
25/02/2013AMCFMEDIANAResuelve en gran forma la desventaja de la MEDIA.Es un valor intermedio, ya que la mitad de los valores de los valores estn por debajo de ella y la otra mitad por arriba.Se denota X.
Se emplea para conjuntos de datos relativamente pequeos
25/02/2013AMCFMEDIANAPara obetnerla:
1.- ordenar los valores: a) Si son datos impares, la mediana es el nmero que se localiza exactamente a la mitad de la lista.
b) Si son datos pares, se obtiene calculando la media de los dos nmeros que estan a la mitad.
25/02/2013AMCFMEDIANAEjemplo
3,50 3,57 9,0 1,3 5,6 8,3, 0,3
3,50 3,57 1,3 5,6 8,3, 0,3
25/02/2013AMCFMODAEs el valor que se presenta con mayor frecuencia.
Cuando dos valores se presentan con la misma frecuencia y sta es la ms alta , ambos son MODAS, por lo que el conjunto es BIMODAL.
Cuando ms de dos valores se presentan con la misma frecuencia y sta es la ms alta , ambos son MODAS, por lo que el conjunto es MULTIMODAL
Cuando NINGN VALOR SE REPITE ,no hay moda
25/02/2013AMCFMODAEs la nica que puede usarse con datos de medicin NOMINAL
25/02/2013AMCFMITAD DEL RANGOEs el valor que esta a la mitad ,entre la puntuacin ms alta y la ms baja.
Se obtiene sumando la puntuacin ms alta con la puntuacin ms baja y el resultado se divide entre dos
25/02/2013AMCFMEDIA DE DISTRIBUCIN DE FRECUENCIASSe obtiene multiplicando la frecuencia por la marca clase de cada dato.Luego sumamos todos los resultados y los dividimos entre el nmero de datos de la frecuencia
Distribucin de frecuencia: Edades de las mejores actricesEdad de las actricesFRECUENCIAS21-302831-403041-501251-60261-70271-802
25/02/2013AMCFCLCULO DE LA MEDIA DE UNA DISTRIBUCIN DE FRECUENCIASEdad de las actricesFRECUENCIASMarca de la claseF*X21-302825.571431-403035.5106541-501245.554651-60255.511161-70265.513171-80275.5151
762748 2748 / 76 = 35.8
Produce una aproximacin a X ,ya que no se emplea la lista original
25/02/2013AMCFMEDIA PONDERADACuando los valores varan de acuerdo a su importancia.
control de lectura 30% nota 16Tarea acadmica 50% nota 10Examen 20% nota 13
(30*16) + (50*10) + (20*13) / (30+20+50)
25/02/2013AMCFSESGOEs una comparacin entre la media,mediana y la moda.Una distribucin es sesgada si no es simtrica: a) sesgada a la izquierda. Media y mediana estn a la izquierda de la modab) sesgada a la derecha. Media y mediana estn a la derecha de la moda.
Una distribucin es simtrica si la moda,mediana y media son iguales
RecordarDistribucin de Frecuencias
2.1.1.- Medida AritmticaDefinicinEn un conjunto de datos agrupados: {(xi , ni); i=1,...,k} N = n1 + n2 + ... + nk: el nmero de datos observados
Se define la Media Aritmtica por
2.1.1.- Medida Aritmtica
Variables cuantitativas continuas o agrupadasxi sern marcas de claseVariables cuantitativas discretas o no agrupadas
Variables cualitativas no tiene sentidoClculo
2.1.1. Media AritmticaEjemplo: Estaturas de 50 nios. Fuente: Pea y Romo 1997.
2.1.1.- Medida Aritmtica
Ejemplo: Estaturas de 50 nios. Fuente: Pea y Romo 1997. Los nios tienen una estatura media de 1,569 m
2.1.1.- Medida Aritmtica
Ejercicio:
2.1.1.- Medida Aritmtica
Ejercicio:
2.1.2.- Medida Aritmtica PonderadaMedia aritmtica en la que se tiene en cuenta la importancia especfica de cada uno de sus datos, a travs de unos pesos, dando as a stos mayor o menor relevancia o aportacin al clculo de la media.
Ejemplo: Las notas obtenidas por un estudiante en cada parte de una determinada materia, as como los pesos de importancia de las distintas unidades, son los que se presentan en la tabla.
2.1.2.- Medida Aritmtica PonderadaDefinicinEn un conjunto de datos agrupados: {(xi , ni); i=1,...,k} N = n1 + n2 + ... + nk: el nmero de datos observados
Sean {wi; i=1,...,k} un conjunto de pesos que ponderan la importancia de cada uno de los datos observados, verificando que: wi 0 para i =1,..., k
Se define la Media Aritmtica Ponderada por
2.1.2.- Medida Aritmtica PonderadaEjemploCalcular la nota media del ejemplo anterior
2.1.3.- Medida Geomtrica
Definicin: Sea X una variable cuantitativa medida en una escala de razn y que slo toma valores positivos. En la distribucin de frecuencias:{(xi , ni); i=1,...,k}
Se define la Media Geomtrica la denotamos G - como:
Es til para promediar tasas, porcentajes, tipos de inters y, en general, en todas aquellas situaciones en las que la variable analizada presente variaciones acumulativas
DefinicinLa Mediana (Me) es aqul valor o dato de la distribucin, que divide a sta en dos partes iguales dejando al 50% de las frecuencias por debajo y al 50% por encima.
Ejemplo: valores observados de una variable : 2, 3, 3, 3, 5, 6, 6, 7 y 9 La mediana es 5, pues es el valor que deja el mismo nmero de datos (4) por debajo que por encima de l.
Para su clculo distinguiremos segn tengamos distribuciones: Discretas Continuas o agrupadas2.1.4 Mediana
Pasos a seguir en su clculo:Ordenamos de forma creciente los datos: Si m < N/2 m+1 con m entero Me = x(m+1)
2.1.4 MedianaDistribuciones discretasEjercicio: 2, 3, 3, 3, 5, 6, 6, 7 y 9 N / 2 = 4,5 4 < 4,5 < 5 Me = x(m+1) = x5 =5
2.1.4.- Mediana
Ejercicio: Distribuciones continuas o con variables agrupadas
Obtener la distribucin de frecuencias acumuladas
Identificar el Intervalo de Clase Mediano (Lm-1,Lm] Es el que verifica que:
Nm-1 < N/2 Nm Fm-1 < 0,50 Fm
y/o tomar la marca de clase
2.1.4.- Mediana
Identificar el Intervalo de Clase Mediano (Lm-1,Lm] Es el que verifica que:
102 = Nm-1 < 105,2 = N/2 Nm = 150 0,484 = Fm-1 < 0,50 Fm = 0,711
(100 120] o marca de clase = 110
DefinicinLa Moda (Mo) de una distribucin de frecuencias es el valor ms frecuente de la misma. Dependiendo del nmero de modas, las distribuciones se clasifican en Unimodales, Bimodales o Multimodales.Ejemplo: valores observados de una variable : 2, 3, 3, 3, 5, 6, 6, 7 y 9 La moda es 3, pues es el valor ms frecuente.
Para su clculo distinguiremos segn tengamos distribuciones: Discretas Continuas o agrupadas2.1.5 Moda
Se identifica el valor Mo = xm cuya frecuencia absoluta nm sea mxima 2.1.5 ModaDistribuciones discretas
Como los valores de la variable estn incluidos en intervalos de clase no es posible identificar directamente el valor o valores centrales.
Pasos a seguir en su clculo:
Obtener la densidad de frecuencia (dm=nm/am)
Identificar el Intervalo de Clase Modal (Lm-1,Lm] Es el que maximiza dm y/o tomar la marca de clase
2.1.5 ModaDistribuciones continuas o agrupadas
2.1.5.- ModaEjercicio:
Obtener la distribucin de densidades de frecuencias
Identificar el Intervalo de Clase Modal (Lm-1,Lm] Es el que maximiza la densidad de frecuenciasTomar la marca de clase
2.1.5.- Moda
Identificar el Intervalo de Clase Modal (Lm-1,Lm] Es el que verifica que maximiza di = 2,4(100 120] o marca de clase =110
108
1.3. Caractersticas de variables estadsticas unidimensionales 1.3.1 Caractersticas de Posicin Media aritmticaEstaturaN Personasn iM. Clasex in i x i140 150201452900150 16010015515500160 1808017013600180 200101901900n = 21033900
109175224453362341nixi
Ejemplo
Datos en tablaDatos en serie2, 2, 3, 3, 3, 3, 5, 6, 7Mo = 3Mo = 3 Valor de la variable ms frecuente Puede haber ms de una moda Plurimodal
Moda
Variables discretas
110
x in ih i = n i / a i140 160301.5160 170222,2170 180202180 190181,8190 200101100
Variables continuas Ejemplo Observaciones:1. Puede utilizarse la frecuencia relativa2. Si las amplitudes son iguales, la moda se puede obtener directamente con las frecuencias
111 Valor de la variable que ocupa el lugar central en una serie de datos ordenados. El 50% de los elementos de la poblacin tienen un valor de la variable menor o igual que la mediana. El 50% de los elementos de la poblacin tienen un valor de la variable mayor o igual que la mediana.N par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 Me = 6 7 Indeterminada entre 6 y 7 Mediana Variables discretas
Datos en serie
xiniNifiFi2330,3330,3333140,1110,4445150,1110,5556160,1110,6667280,2220,8888190,1110,99991
xiniNifiFi3110,10,14120,10,26350,30,57160,10,68280,20,892100,21101
N impar de observaciones: 2, 2, 2, 3, 5, 6, 7, 7, 8 Me = 5
112
Datos en tabla Variables discretasn /2 = 14Fi = 0,5
Me = 2 Ejemplo28
43210xi28351064ni
10.8920.7140.3570.142Fi 10.1070.1780.3570.2140.142fi
2520104Ni
Observacin: Si n / 2 coincide con un N i
la mediana est indeterminada entre x i y x i+1
113
n/2 = 50Fi = 0,5
Variables continuas Ejemplo Observacin: Si n/2 coincide con un Ni la mediana es el extremo superior del intervalo que le corresponde
10.900.700.450.15Fi
0.100.200.250.300.15fi
10090704515Ni
100
10180 20020170 18025160 17030150 16015140 150niEstatura
ESTADSTICA PARA DESCRIBIR,EXPLORAR Y COMPARAR DATOS
SEXTA SEMANA
25/02/2013AMCF
114ytytkyutyu
MEDIAS DE DISPERSIN O VARIABILIDAD
AB
Algunas consideracionesVariacin, se refiere a la cantidad en que los datos u observaciones varan entre si, esta variacin puede medirse.
Los datos que estn relativamente cercanos entre si, tienen bajas medidas de variabilidad, mientras que los que estn mas alejados entre si tienen medidas de variacin mas grandes,
Trminos equivalentesMenor dispersin = ms homogneoMayor dispersin = menos homogneoMenor dispersin = menos heterogneoMayor dispersin = ms heterogneo
MEDIDAS DE DISPERSIONDefinicin 1Una medida de dispersin de un conjunto de datos, mide cuan esparcidos se encuentran estos o que tan heterogneos son. Hay varias medidas de dispersin, siendo las ms comunes las siguientes:
Principales medidas de dispersinEl rangoRango IntercuartilLa varianza La desviacin estndarEl coeficiente de variacin
RANGOR = X mx X min
Ejemplo 1Ante la pregunta sobre nmero de hijos por familia, una muestra de 12 hogares, marc las siguientes respuestas:2124132320 51Calcule el rango de la variable
SolucinEl Rango es R =5 0 = 5
La varianza
MuestralPoblacional
Ejemplo 2Calcule la varianza para los datos del ejemplo 1 2 1 2 4 1 3 2 3 2 0 51
Solucin:
Desviacin estndar
MuestralPoblacional
Ejemplo 3Calcule la desviacin estndar para los datos del ejemplo 1
Solucin:
Calcula la desviacin estndar para los datos del ejemplo 1
2. Ingresa los datos. 3. Solicita xn-1. 1. Ingresa a modo STAT.
Calcula la desviacin estndar para los datos del ejemplo 1
2. Ingresa los datos. 3. Solicita xn-1. 1. Ingresa a modo SD.
Coeficiente de variacinCompara la variabilidad de series de datos que tengan unidades diferentes.No tiene unidades de medida.Se calcula para variables medidas en escala de razn
MuestralPoblacional
Ejemplo 4Calcule el coeficiente de variabilidad para los datos del ejemplo 1 Solucin:
Medidas de dispersin en tablas de frecuencias (caso discreto)
MuestralPoblacional
Ejemplo 5Se han registrado durante 20 das, el nmero de viajeros que hacen reservaciones a una agencia de viajes pero que no las hacen efectivas:Calcule las medidas de dispersin de la variable en estudio. Interprete iNmero de viajeros: xi fi11232133314641535165Total7020
Solucinixifixifixi2xi2fi11233614443221333916950731468419611764153452256755165802561280Total70202849904070
Una variable cuantitativa continuaVarianza poblacional
Varianza muestral
Propiedades de la varianzaEs un nmero real no negativo.Si yi=axi+b entonces S2Y = a2S2X .Depende de todos los datos y es sensible a la variacin de cada dato.Se puede calcular en variables medidas en escala de intervalo y de razn.
Estadsticos apropiados por escalasNominalModa, nmero de casosOrdinalMediana, percentilIntervaloMedia, rango, rango intercuartil, varianza, desviacin estndarRaznTodos
Ejemplo 6En un grifo se form la siguiente distribucin de frecuencias de galones de gasolina vendidos por automvil, en una muestra de 300 vehculos:Galones de gasolinafrecuencia0 6506 - 129512 - 186518 - 245024 -302530 - 3615total300
Calcule e interprete las medidas de Dispersin
SolucinGalones xifiFihiHi0 63505016,6716,676 - 1299514531,6748,3312 - 18156521021,6770,0018 - 24215026016,6786,6724 -3027252858,3395,0030 - 3633153005,00100,00total300
138
Q 3 Q1
Valor mximo menos valor mnimo de la variable Miden la Homogeneidad de las observaciones 1.3.2. Caractersticas de Dispersin Rango o recorrido Recorrido intercuartlico
139
Varianza Desviacin tpica Coeficiente de variacin
140xininixinixi242080320640240144084435228161036360360012222643168162129611344
Ejemplo
141
Momentos centrales (Respecto a la media)
CUATILES,DECILES,PERCENTILES
SEPTIMA SEMANA
25/02/2013AMCF
142ytytkyutyu
ObjetivosDe las diferentes medidas descriptivas de una distribucin de frecuencias, que se presentan a lo largo del tema, el alumno deber comprender el inters y el objetivo de cada una de ellas; as mismo sabr aplicar su definicin y manejar sus principales propiedadesTodas ellas comparten el propsito comn de servir de indicadores de la Posicin (Central y No Central) que ocupan un conjunto de datos. De esta forma, con su uso se aprender a sintetizar o resumir la informacin contenida en un conjunto de datos indicando su POSICIN globalInterpretar correctamente los valores obtenidos para estas medidasDiferenciar y elegir aquella medida - de entre las alternativas presentadas - que resulte ms conveniente para describir los aspectos que se pretenden poner de manifiesto.
Medidas de Posicin Medidas de tendencia central Media aritmtica, geomtrica y ponderada, Mediana y Moda
Medidas no centrales Cuantiles: Cuartiles, deciles, percentiles
144
IntroduccinUn objeto pequeo se pesa con un mismo instrumento por ocho estudiantes de una clase, obtenindose los siguientes valores en gramos: 62, 60, 60, 63, 61, 623, 615, 62 Cul sera la mejor estimacin del peso real?
Cmo determinar, a partir de un conjunto de medidas x1, x2 , ..., xn la mejor estimacin posible del verdadero valor X desconocido?
1 IntroduccinCul sera la mejor estimacin del peso real?61475? (62 + 60 + 60 + 63 + 61 + 623 + 615 + 62) / 860 ,62? Valores que ms se repiten615 62? 60, 60, 61, 615, 62, 62, 623, 63No tenemos ninguna razn para pensar que el verdadero valor est ms cercano a uno u otro de los datos obtenidos.
Unidad 2: Medidas de Posicin1 IntroduccinLas Medidas de Posicin van a desvelar aquellos valores con respecto de los cuales, los datos suelen disponerse.
Son magnitudes que pueden considerarse como representativas del grueso de los datos, sirviendo de referencia a los mismosSe clasifican en:Medidas de centralizacinMedidas de posicin no centrales
1 Introduccin
Son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas contiene el mismo nmero de frecuencias.
Los tipos ms importantes de cuantiles son:
Los cuartiles, que dividen a la distribucin en cuatro partes Los deciles, que dividen a la distribucin en diez partes Los percentiles, que dividen a la distribucin en cien partes2.2.Cuantiles
DefinicinPara 0 (p) 1 se define el Cuantil de orden (p) como el valor de la variable o dato tal que el x 100 de los datos son inferiores. Lo denotamos Q (Qp)
Casos particulares notables son los: Percentiles, Cuartiles y Deciles2.2.Cuantiles
Q70
Distribuciones discretas Si m < Np m+1 con m entero entonces Qp = x(m+1)
Distribuciones Continuas o AgrupadasSu aproximacin se basa en un argumento idntico al utilizado en el clculo de la Mediana para datos agrupados2.2.Cuantiles
Cuartiles: {Ci = Qi/4 i = 1, 2, 3}
Primer Cuartil C1 Cuantil 0.25 (Q0.25) Segundo Cuartil C2 Cuantil 0.5 (Q0.5) Tercer Cuartil C3 Cuantil 0.75 (Q0.75)
Deciles: {Di = Qi/10 i = 1, ..., 9}
Percentiles: {Pi = Qi/100 i = 1, ...,99}
Ejemplo: En cualquier conjunto de datos: El percentil P95 es superado nicamente por el 5% de los datos.2.2.- Cuantiles
Ejemplo 1: El 15% de los espaoles viven por debajo del umbral de pobreza. Qu renta se considera demasiado baja? Percentil 15
Ejemplo 2: El colesterol se distribuye en la poblacin simtricamente. Supongamos que se consideran patolgicos los valores extremos, de forma que el 90% de los individuos son normales Entre qu valores se encuentran los individuos normales? Percentiles 5 y 952.2.- Cuantiles
Ejemplo 1: Calcular el cuartil 2 y el percentil 952.2.- Cuantiles
Cuartil 2 = Percentil 50 = Mediana
Ejemplo 1: Calcular el cuartil 2 y el percentil 952.2.- CuantilesPercentil 95
Qu es lo que hemos visto?
158 Definicin: Pk , k: 1,2,...,99, percentil k, valor de la variable que deja por debajo, el k% de los valores de la variableQ1 = P25 Cuartil 1Q2 = P50 Cuartil 2 = MeQ3 = P75 Cuartil 3
D1 = P10 Decil 1D2 = P20 Decil 2 .D9 = P90 Decil 9 Percentiles Clculo para v.e. discretas:Igual que la mediana, cambiando:
Clculo para v.e. continuas:
159x in iNi220203305044494520114610124124
Percentil 40, P40 = 3Percentil 95, P95 = 6
n k /100 =124x25/100 = 31
n k /100 =124x50/100 = 62
n k /100 =124x75/100 = 93
Ejemplos percentiles v.e. discretaPercentil 50, P50 = 4 = Me = Q2
Percentil 25, P25 = 3 = Q1
Percentil 75, P75 = 4 = Q3
160
Ejemplos percentiles v.e. continuaTallasniNifiFi140-15015150.150.15150-16030450.300.45160-17025700.250.70170-18020900.200.90180-200101000.101100
MEDIDAS DE ASIMETRA Y CURTOSIS
OCTAVA SEMANA
25/02/2013AMCF
161ytytkyutyu
162
1.3.3 Caractersticas de forma
Distribucin sesgada a la derecha
Distribucin simtrica
Distribucin sesgada a la izquierda Coeficiente de Sesgo (Asimetra)
163
Distribucin ms aplastada que la distribucin Normal
Distribucin menos aplastada que la distribucin Normal
Distribucin igual de aplastada que la distribucin Normal
Coeficiente de Curtosis (Aplastamiento)
25/02/2013AMCF
25/02/2013AMCF