matemáticas aplicadas

33
Matemáticas aplicadas Estadística

Upload: ivette

Post on 20-Sep-2015

12 views

Category:

Documents


0 download

DESCRIPTION

LA ESTADISTICA*MANEJO DE INFORMACIÓN*MEDIDAS DE TENDENCIA*MEDIDAS DE DISPERSIÓN*MEDIDAS DE FORMA*MEDIDAS DE CORRELACION*APLICACIONES

TRANSCRIPT

Matemticas aplicadas

Estadstica

NDICE:PG.1. ESTADSTICA 2

2. MANEJO DE INFORMACIN. 42.2. Frecuencias 42.3. Distribucin de frecuencias.. 52.4. Representacin grfica e interpretacin 6

3. MEDIDAS DE TENDENCIA. 123.1. Media aritmtica.. 123.2. Mediana 123.3. Moda. 133.4. Cuantines 13

4. MEDIDAS DE DISPERSIN 154.1. Rango.. 154.2. Desviacin media.. 154.3. Desviacin estndar.. 164.4. Varianza 16

5. MEDIDAS DE FORMA... 165.1. Sesgo o asimetra 165.2. Curtosis o apuntamiento 17

6. MEDIDAS DE CORRELACIN 186.1. Coeficiente de correlacin.. 196.2. Recta de regresin... 206.3. Error estndar de estimacin. 21

7. APLICACIONES 22

8. BIBLIOGRAFAS... 24

ESTADSTICA:Se designa con el nombre de estadstica a aquella ciencia que ostenta en sus bases una fuerte presencia y accin de las matemticas y que principalmente se ocupa de la recoleccin, anlisis einterpretacinde datos que buscan explicar las condiciones en aquellos fenmenos de tipo aleatorio.Se divide en dos reas: Estadstica descriptivaLa descripcin completa de una variable aleatoria est dada por su funcin densidad de probabilidad(fdp). Afortunadamente una gran cantidad de variables de muy diversos campos estn adecuadamente descritas por unas pocas familias defdps: binomial, Poisson, normal, gamma, etc. Dentro de cada familia, cadafdpest caracterizada por unos pocos parmetros, tpicamente dos: media y varianza. Por tanto la descripcin de una variable indicar la familia a que pertenece la fdp y los parmetros correspondientes. Estadstica inferencial. Los dos tipos de problemas que resuelven las tcnicas estadsticas son: estimacin y contraste de hiptesis. En ambos casos se trata de generalizar la informacin obtenida en una muestra a una poblacin. Estas tcnicas exigen que la muestra sea aleatoria. En la prctica rara vez se dispone de muestras aleatoriasEn unestudio estadsticodistinguimos:a) Poblacin: representa todo el conjunto de elementos que posee la informacin que vamos a analizar.b) Muestra: del total de la poblacin se selecciona un grupo representativo que es el que vamos a estudiar.c) Individuo: cada elemento de la muestra. En este ejemplo cada ciudadano del grupo de 2.000 que hemos seleccionado.

d) Variable estadstica: es la informacin que vamos a analizar. Se pueden analizar varias variables: por ejemplo podramos analizar la estatura (1 variable) distinguiendo por sexo (2 variable) y por edades (3 variable).Las variables pueden ser: Cualitativas: caractersticas que no se pueden representar numricamente. Por ejemplo, sexo. Cuantitativas: caractersticas que s se pueden representar numricamente. Por ejemplo, altura y edad.Estas variables numricas a veces pueden tomar valores muy concretos (por ejemplo, nmero de aos en el colegio: de 1 a 15), en cuyo caso se denominanvariables cuantitativas discretas, y otras veces pueden tomar un nmero casi ilimitado de valores (por ejemplo, estatura; 1,41, 1,42, ... 1,54, 1,55, 1,81, 1,82, .) en cuyo caso se denominanvariables cuantitativas continuas.Para hacer ms manejable la informacin,las variables cuantitativas continuas se suelen agrupar por intervalos: por ejemplo estatura de 1,40 a 1,45, de 1,46 a 1,50, de 1,55 a 1,60, . De esta manera reducimos los grupos de respuesta.Cuando agrupamos la informacin por intervalos podemos denominarlos indicando el valor inferior y superior de cada intervalo (por ejemplo, intervalo del 1,40 al 1,45), o tambin podemos denominarlo indicando el valor central de cada intervalo (por ejemplo el intervalo 1,40 al 1,45 lo identificaramos por 1,425). A este valor representativo de cada intervalo se denomina marca de clase.e) Modalidad: son los valores que pueden tomar las variables.

MANEJO DE LA INFORMACIN:Manejo de Informacin(IMpor su sigla en ingls) es la recoleccin y el manejo de la informacin de uno o ms fuentes y la distribucin de esa informacin a uno o ms audiencias. Esto en algunos casos involucra a ellos quienes tienen un papel en la produccin o un derecho sobre la informacin. Gerenciar significa la organizacin de y el control sobre la estructura, el procesamiento y el envo de la informacin.Frecuencia:Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Estos nmeros se denominanfrecuencias: As tenemos los siguientes tipos de frecuencia:a) Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos porni

b) Frecuencia relativa: La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto defrecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos porfi DondeN= Tamao de la muestra

c) Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos porNi.d) Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos porFi e) Porcentaje Acumulado: Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar porPicomo la frecuencia relativa acumulada multiplicada por 100. Distribucin de frecuencias:Enestadstica, se le llamadistribucin de frecuenciasa la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Frecuencia absoluta (ni):corresponde al nmero de veces que se observa dicho valor, o en otras palabras al nmero de veces que se presenta un cierto dato.Para agrupar los datos por su frecuencia, se deben seguir los siguientes pasos: Se ordenan los datos en orden creciente o decreciente. Se cuenta la frecuencia absoluta de cada valor (cuntas veces se repite cada magnitud)

Frecuencia absoluta Acumulada (Ni): es la suma de las frecuencias absolutas de cada intervalo. La frecuencia acumulada hasta el ltimo intervalo es igual a la frecuencia total de toda la distribucin.

Frecuencia relativa (fi):>corresponde a la razn (divisin) entre la frecuencia absoluta(ni)y el nmero total(N)de individuos de la poblacin.

Representacin grfica e interpretacin:La representacin grfica de una distribucin de frecuencias depende del tipo de datos que la constituya.Datos correspondientes a un carcter cualitativoLa representacin grfica de este tipo de datos est basada en la proporcionalidad de las reas a las frecuencias absolutas o relativas. Veremos dos tipos de representaciones:1. Diagrama de sectores: Est representacin grfica consiste en dividir un crculo en tantos sectores circulares como modalidades presente el carcter cualitativo, asignando un ngulo central a cada sector circular proporcional a la frecuencia absolutani, consiguiendo de esta manera un sector con rea proporcional tambin ani.As, los ngulos que corresponden a las cuatro modalidades de la tabla adjunta sern:Nmero de casosngulo(grados)

Rehusaron ciruga26234

Rehusaron radiacin327

Empeoraron poruna enfermedadajena al cncer1090

Otras causas19

Y su representacin en un diagrama de sectores ser: 2. Diagrama de rectngulos: Esta representacin grfica consiste en construir tantos rectngulos como modalidades presente los caracteres cualitativos en estudio, todos ellos con base de igual amplitud. La altura se toma igual a la frecuencia absolua o relativa (segn la distribucin de frecuencias que estemos representando), consiguiendo de esta manera rectngulos con reas proporcionales a las frecuencias que se quieren representar.Ejemplo: La representacin grfica de la distribucin de frecuencias absolutas del ejemplo anterior ser de la forma: Datos sin agrupar correspondientes a un carcter cuantitativoEstudiaremos dos tipos de representaciones grficas, correspondientes a distribuciones de frecuencias (absolutas o relativas) no acumuladas y acumuladas.1. Diagrama de barras: Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta o relativa, dependiendo de la distribucin de frecuencias que estemos representando.As, la representacin grfica de la distribucin de frecuencias delejemplo del n de hijosser: 2. Diagrama de frecuencias acumuladas: Esta representacin grfica se corresponde con la de una funcin constante entre cada dos valores de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o absoluta acumulada si se trata de representar una distribucin de frecuencias absolutas) hasta el menor de los dos valores de la variable que construyen el tramo en el que es constante.Tambin para el ejemplo delNmero de Hijos, se tendr undiagrama de frecuencias acumuladascomo el del siguiente grfico: Datos agrupados en intervalos correspondientes a un carcter cuantitativoAl igual que antes, existen tambin dos tipos de representaciones grficas dependiendo de si la distribucin de frecuencias en estudio es de datos acumulados o de datos sin acumular.1. Histograma:Al ser esta representacin una representacin por reas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al serFrecuencia (rea) = amplitud del intervalo alturala altura correspondiente a cada intervalo puede tomarse igual a la frecuencia.Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma que la ecuacin anterior se cumpla.En el ejemplo de losNiveles de Colinesterasa, al tener los intervalos igual amplitud, la representacin grfica ser: Ejemplo: Si tuviramos una distribucin de frecuencias como la siguiente, correspondiente a puntuaciones obtenidas en un test psicolgico y en la que los intervalos son de diferente amplitudIinifi

0-2088/70

20-3099/70

30-401212/70

40-451010/70

45-5099/70

50-601010/70

60-8088/70

80-10044/70

?ni= 70?fi=1

Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de 2/70 para que el rea sea la freceuncia relativa 8/70. Procediendo de la misma manera con el resto de los intervalos obtendramos como representacin grfica la figura siguiente: Obsrvese que la suma de todas las reas debe ser 1, tanto si los intervalos de la distribucin de frecuencias relativas son o no de igual amplitud.2. Polgono de frecuencias acumuladas: Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en representar la grfica de una funcin que una por segmentos las alturas correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo superior del ltimo.As, para el ejemplo de losNiveles de Colinesterasa, elpolgono de frecuencias relativas acumuladastendr una representacin grfica de la forma:

MEDIDAS DE TENDENCIAAl describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denominamedidaoparmetro de tendencia centralode centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas comomedidas de posicin. En este caso se incluyen tambin loscuantilesentre estas medidas.La media aritmticaRepresenta el valor medio que toman los datos de una observacin estadstica. Se calcula sumando todos los resultados y dividiendo la suma entre el nmero de registros. La media aritmtica tan slo se puede calcular con datos numricos (no se puede calcular con datos cualitativos).El smbolo de lamedia aritmtica. Mediana Es el valor que toma la variable de manera que al ordenarla de menor a mayor quedara justo en el centro, siendo el 50% de los registros menores que ella y el otro 50% superiores a ella. Lamedianase representa porMe. Lamedianase puedehallarslo paravariables cuantitativas.#Clculo de la mediana1Ordenamoslosdatosdemenor a mayor.2Si la serie tiene unnmero impar de medidaslamedianaes lapuntuacin centralde la misma.2, 3, 4, 4, 5, 5, 5, 6, 6Me= 53Si la serie tiene unnmero parde puntuaciones lamedianaes lamediaentre las dos puntuaciones centrales.7, 8, 9, 10, 11, 12Me= 9.5Moda: Es el resultado ms repetido en una observacin estadstica (se puede calcular con datos numricos y cualitativos). Se representa porMo. Se puede hallar lamodaparavariables cualitativasy cuantitativas.Hallarlamodade la distribucin:2, 3, 3, 4, 4, 4, 5, 5 Mo= 4Si en un grupo haydos o varias puntuacionescon lamisma frecuenciay esa frecuencia es la mxima, ladistribucinesbimodalomultimodal, es decir, tienevarias modas.1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9Cuando todas laspuntuacionesde un grupo tienen lamisma frecuencia,nohaymoda.2, 2, 3, 3, 6, 6, 9, 9Sidos puntuaciones adyacentestienen lafrecuencia mxima, lamodaes elpromediode las dos puntuaciones adyacentes.0, 1, 3, 3, 5, 5, 7, 8 Mo = 4Cuantiles:Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas contiene el mismo nmero de frecuencias.

Los cuantiles ms conocidos son:a) Cuartiles (Qi): Son valores de la variable que dividen a la distribucin en 4 partes, cada una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1es el primer cuartil que deja a su izquierda el 25 % de los datos; Q2es el segundo cuartil que deja a su izquierda el 50% de los datos, y Q3es el tercer cuartil que deja a su izquierda el 75% de los datos. (Q2= Me)

b) Deciles (Di): Son los valores de la variable que dividen a la distribucin en las partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habr 9 deciles. (Q2= D5= Me)

c) Centiles o Percentiles (Pi): Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habr 99 percentiles. (Q2= D5= MeP50)

d) Percentiles:son 99 valores que dividen la serie de datos en 100 partes iguales: P1, P2, ..., P99.Clculo de los cuantilesDebido a que los cuantiles son parmetros del tipo de la mediana, su clculo se realiza de forma anloga.Algunas de las frmulas son las siguientes: MEDIDAS DE DISPERSIN:Son parmetros estadsticos que indican como se alejan los datos respecto de la media aritmtica. Sirven como indicador de la variabilidad de los datos. Las medidas de dispersin ms utilizadas son el rango, la desviacin estndar y la varianza.Rango: Indica la dispersin entre los valores extremos de una variable. se calcula como la diferencia entre el mayor y el menor valor de la variable. Se denota comoR.Para datos ordenados se calcula como:R = x(n)- x(1)Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.Desviacin media: Ladesviacin respecto a la mediaes ladiferenciaentre cadavalorde la variable estadstica y lamedia aritmtica.Di= x -xLadesviacin mediaes lamedia aritmticade losvalores absolutos de las desviaciones respecto a la media.Ladesviacin mediase representa por

Desviacin estndar:Ladesviacin estndar o desviacin tpicaes laraz cuadrada de la varianza.Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.Ladesviacin estndarse representa por.

VarianzaLavarianzaes lamedia aritmtica del cuadrado de las desviaciones respecto a la mediade una distribucin estadstica. La varianza se representa por.

MEDIDAS DE FORMA:Sesgo o Asimetra:Laasimetraes la medida que indica la simetra de la distribucin de unavariablerespecto a lamedia aritmtica, sin necesidad de hacer la representacin grfica. Los coeficientes de asimetra indican si hay el mismo nmero de elementos a izquierda y derecha de lamedia.Existentres tiposde curva de distribucin segn suasimetra: Asimetra negativa: la cola de la distribucin se alarga para valores inferiores a lamedia. Simtrica: hay el mismo nmero de elementos a izquierda y derecha de lamedia. En este caso, coinciden la media, lamedianay lamoda. La distribucin se adapta a la forma de la campana de Gauss, o distribucin normal. Asimetra positiva: la cola de la distribucin se alarga para valores superiores a lamedia.

Curtosis o Apuntamiento:Lacurtosis(oapuntamiento) es una medida de forma que mide cun escarpada o achatada est una curva o distribucin.Este coeficiente indica la cantidad de datos que hay cercanos a lamedia, de manera que amayor grado decurtosis, ms escarpada(o apuntada) ser la forma de la curva.

Lacurtosisse mide promediando la cuarta potencia de la diferencia entre cada elemento del conjunto y lamedia, dividido entre ladesviacin tpicaelevado tambin a la cuarta potencia. Sea el conjuntoX=(x1, x2,, xN), entonces el coeficiente decurtosisser:

MEDIDAS DE CORRELACIN:La correlacin estadstica constituye una tcnica estadstica que nos indica si dos variables estn relacionadas o no.Por ejemplo, considera que las variables son el ingreso familiar y el gasto familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos. Por lo tanto, estn relacionados en el sentido de que el cambio en cualquier variable estar acompaado por un cambio en la otravariable.De la misma manera, los precios y la demanda de un producto son variables relacionadas; cuando los precios aumentan la demanda tender a disminuir y viceversa.Si el cambio en una variable est acompaado de un cambio en la otra, entonces se dice que las variables estn correlacionadas. Por lo tanto, podemos decir que el ingreso familiar y gastos familiares y el precio y la demanda estn correlacionados.Relacin Entre las VariablesLa correlacin puede decir algo acerca de larelacin entre las variables. Se utiliza para entender:1. si la relacin es positiva o negativa2. la fuerza de la relacin.La correlacin es una herramienta poderosa que brinda piezas vitales de informacin.En el caso del ingreso familiar y el gasto familiar, es fcil ver que ambos suben o bajan juntos en la misma direccin. Esto se denomina correlacin positiva.En caso del precio y la demanda, el cambio se produce en la direccin opuesta, de modo que el aumento de uno est acompaado de un descenso en el otro. Esto se conoce como correlacin negativa.Coeficiente de CorrelacinLacorrelacin estadsticaes medida por lo que se denomina coeficiente de correlacin (r). Su valor numrico vara de 1,0 a -1,0. Nos indica la fuerza de la relacin.En general, r> 0 indica una relacin positiva y r