apuntes estadistica

15
ESTADÍSTICA ESTADÍSTICA Introducción En la práctica con frecuencia estamos interesados en establecer conclusiones válidas sobre un grupogrande de individuos u objetos. En lugar de examinar el grupo completo, llamado población, lo cual pue imposible, examinamos solamente una parte pequeña de esa población, llamamos muestra. Hacemos esto con el ánimo de inferir ciertos hech población a partir de los resultados que encontramos en la muestra, conocido como inferencia estadística. El proceso de obtención de mu denomina muestreo. El origen de la estadística se remonta a dos tipos de actividades h aparentemente tienen poco en comn! "a política# los juegos de azar . "a estadística difícilmente se podrá entender completamente sin el es de la probabilidad. El estudio de la probabilidad a mediados del siglo $%&&&, motivado por el inter's de los juegos de a(ar, condujo al tratamiento matemá errores de la medición # a la teoría que ho# constitu#e la base de En ese mismo siglo, la necesidad de la descripción num'ric políticas como ciudades, delegaciones, municipios, estados, países, que ahora se denomina Estadística Descriptiva . )l inicio esta disciplina consis tan solo en presentar datos en tablas # gráficas* en la actualidad la síntesis de ellos mediante descripciones num'ricas. 1.1. Conceptos básicos 1.1.1. Población 1 CEYA 7mo SEMESTRE

Upload: kuroo-kitzunee-luvi

Post on 06-Oct-2015

216 views

Category:

Documents


0 download

DESCRIPTION

matematicas

TRANSCRIPT

ESTADSTICA

ESTADSTICA unideal

ESTADSTICA

IntroduccinEn la prctica con frecuencia estamos interesados en establecer conclusiones vlidas sobre un grupo grande de individuos u objetos. En lugar de examinar el grupo completo, llamado poblacin, lo cual puede ser difcil o imposible, examinamos solamente una parte pequea de esa poblacin, la cual llamamos muestra. Hacemos esto con el nimo de inferir ciertos hechos sobre la poblacin a partir de los resultados que encontramos en la muestra, un proceso conocido como inferencia estadstica. El proceso de obtencin de muestras se denomina muestreo.El origen de la estadstica se remonta a dos tipos de actividades humanas que aparentemente tienen poco en comn: La poltica y los juegos de azar. La estadstica difcilmente se podr entender completamente sin el estudio aplicado de la probabilidad.

El estudio de la probabilidad a mediados del siglo XVIII, motivado enormemente por el inters de los juegos de azar, condujo al tratamiento matemtico de los errores de la medicin y a la teora que hoy constituye la base de la Estadstica.

En ese mismo siglo, la necesidad de la descripcin numrica de entidades polticas como ciudades, delegaciones, municipios, estados, pases, etc., origin lo que ahora se denomina Estadstica Descriptiva. Al inicio esta disciplina consisti tan solo en presentar datos en tablas y grficas; en la actualidad incluye tambin la sntesis de ellos mediante descripciones numricas.

1.1. Conceptos bsicos1.1.1. PoblacinEs el conjunto de elementos, individuos o entes sujetos a estudio y de los cuales queremos obtener un resultado. Normalmente es demasiado grande para poder abarcarlo.

1.1.2. MuestraUna muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.

Est formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).

1.1.3. MuestreoEl muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin.

1.1.4. IndividuoUn individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.

1.1.5. Muestra AleatoriaEs una muestra bien representativa de la poblacin. Se considera que cada elemento de la poblacin ha tenido la misma oportunidad de formar parte de la muestra. Las conclusiones basadas en una muestra son confiables.1.1.6. VariableAl hacer un estudio de una determinada poblacin, observamos una caracterstica o propiedad que vara entre los diferentes elementos o individuos. Cada una de estas caractersticas estudiadas se llama variable estadstica.

Ejemplos: el nmero de hermanos, la estatura, el peso, edad, profesin, etc.

1.1.6.1. Variables Discretas y Continas1.1.6.1.1. Variable discretaCuando los valores que puede tomar una variable cuando estn separados entre s por una determinada cantidad, la variable se denomina variable discreta. Esta variable tiene la presencia de vacos o interrupciones entre los valores que pueden tomar, por ejemplo el nmero de consultas en un hospital durante un da, el total de entradas al Cinepolis durante la primera funcin, etc.

1.1.6.1.2. Variable Contina Una variable continua es aquella que tericamente puede tomar cualquier valor dentro de un intervalo de clases. En esta variable no importa que tan cerca puedan estar dos valores de una variable por ejemplo los cambios de temperatura en una ciudad, las estratosfricas tarifas elctricas exclusivamente en Mexicali, entre otras.

1.1.7. DatoEs un valor particular de la variable.1.1.8. Estadstica. En sus orgenes histricos, la Estadstica estuvo ligada a cuestiones de Estado (recuentos, censos, etc.) y de ah proviene su nombre. Hoy en da est presente en todos los mbitos humanos, tanto individuales como colectivos.La Estadstica surge ante la necesidad de poder tratar y comprender conjuntos numerosos de datos. Los estudios estadsticos, en la actualidad, impregnan numerosos mbitos: sanidad, mundo empresarial, medios de comunicacin, etc.

Definicin. La Estadstica es la ciencia que se ocupa de la recogida de datos, su organizacin y anlisis; as como de las predicciones que, a partir de estos datos, pueden hacerse.

Fases de un estudio estadstico: Recogida de datos Recuento de datos: tablas y grficos estadsticos. Anlisis de los datos: parmetros estadsticos. Extraccin de conclusiones de los datos. Toma de decisiones.

1.1.9. Tipos de EstadsticaSegn se haga el estudio sobre todos los elementos de la poblacin o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadstica:

1.1.9.1. Estadstica descriptivaLa Estadstica descriptiva realiza el estudio sobre la poblacin completa, observando una caracterstica de la misma y calculando unos parmetros que den informacin global de toda la poblacin.

1.1.9.2. Estadstica inferencial. La estadstica inferencial realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la poblacin. Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada.Veamos dos ejemplos que nos aclaren estos dos tipos de Estadstica:

Ejemplo 1: Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las elecciones generales, es muy frecuente que los medios de comunicacin, nos adelanten los resultados de encuestas o sondeos en los que se nos indica el resultado final de dichas elecciones con una precisin y con un error determinado. Estos sondeos son realizados por distintas tcnicas sobre un grupo (muestra) ms o menos numeroso de personas. Naturalmente, cunto mayor sea el nmero de espaoles con derecho a voto encuestados, mayor ser la fiabilidad de la encuesta, pero tambin mayor ser el coste del sondeo. El estudio de esta muestra se hara mediante estadstica descriptiva, pero lo que nos interesa no es el resultado de este estudio reducido sino el resultado final de las elecciones. El paso de generalizar los resultados de la muestra a toda la poblacin, se hace mediante tcnicas de Estadstica inferencial. La eleccin de la muestra debe hacerse mediante mtodos de muestreo para que el estudio resulte lo ms fiable posible.

Ejemplo 2: Supongamos que estamos en un instituto con un nmero muy elevado de alumnos y alumnas, por ejemplo 500, y queremos hacer un estudio estadstico sobre su altura.

Un mtodo sera pasar clase por clase y medirlos a todos, esto nos podra llevar un tiempo considerable pero sera la forma ms exacta de hacer dicho estudio, aunque es fcil encontrarnos con ausencias y tendramos que volver varios das y pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos todos los datos en nuestro poder los resultados los obtendramos mediante Estadstica descriptiva.

Otra posibilidad podra ser pasar clase por clase, decirles a los alumnos y alumnas que anoten su estatura en un papel y recogerlos todos. Tambin as tendramos un estudio de Estadstica descriptiva, aunque seguramente menos fiable que con el mtodo anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos alumnos escriban su estatura a clculo y otros, con ganas de bromas, muy por encima o muy por debajo de la realidad.

Y otra posibilidad sera escoger una muestra, es decir un grupo de por ejemplo 50 personas, hacer el estudio descriptivo sobre ellas y despus generalizarlo a todo el instituto con Estadstica inferencial. En este caso, comprobaramos por una parte que cuanto mayor sea la muestra ms trabajo tendremos, pero ms fiable ser el resultado final y por otra, que la eleccin de la muestra debe hacerse de manera que permita tambin fiarnos del resultado obtenido. Si estamos en segundo de bachillerato, podramos coger como muestra los 50 alumnos de este curso? Por qu? Qu forma de elegir la muestra se te ocurre?

1.2. Recuento y agrupamiento de datos (tablas estadsticas)

Una vez que hemos observado y recogidos los datos, bien a travs de encuestas, bien con bases de datos ya almacenados, debemos resumir la informacin de forma adecuada y til para su posterior estudio.

Atendiendo al problema que estemos estudiando, realizamos el agrupamiento de datos de una forma u otra:

1) Si la variable es cualitativa, observamos y contamos el nmero de individuos de la poblacin que presentan cada una de las distintas modalidades del carcter.

Ejemplo 3: Un estudio hecho en un conjunto de 24 personas con objeto de determinar su grupo sanguneo ha conducido a los siguientes resultados:

A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O.

MODALIDADRECUENTOFRECUENCIA

AIIIII IIIII I11

BIIIII I6

ABI1

OIIIII I6

2) Si la variable es cuantitativa discreta, observamos y contamos el nmero de individuos de la poblacin que presentan cada uno de los distintos valores del carcter o variable, si son pocos valores.

Ejemplo 4: Las calificaciones obtenidas en un ejercicio se recogen en el siguiente grfico:

CALIFICACIONESRECUENTOFRECUENCIA

1I1

2II2

3I1

4II2

5III3

6IIII4

7III3

8I1

9II2

10I1

Ejemplo 5: Preguntamos a 20 alumnos el nmero de miembros de su familia, y sus respuestas fueron:

35435683357565447453

MIEMBROS DE LA FAMILIARECUENTOFRECUENCIA

3IIIII5

4IIII4

5IIIII I6

6II2

7II2

8I1

3) Si la variable es cuantitativa continua sus valores se distribuyen en intervalos de clase. Al agrupar los valores de una variable en intervalos de clase, se simplifica su descripcin, pero se pierde precisin: cuanto menor sea el nmero de intervalos que se consideren, menor ser la precisin, y viceversa.

1.3. Distribuciones de frecuencias y representaciones grficas1.3.1. Distribucin de frecuenciasDatoSe les llama datos sueltos a los datos recolectados que no han sido organizados numricamente. Un ejemplo es el conjunto de las estaturas de 100 estudiantes hombres, obtenidas del registro universitario, que est ordenado en forma alfabtica.OrdenacinUna ordenacin es un conjunto de datos numricos en orden creciente o decreciente de magnitud. A la diferencia entre el nmero mayor y el menor se le conoce como rango de los datos. Por ejemplo, si la estatura mayor de los 100 estudiantes es 74 pulg y la menor es 60, el rango es 74-60= 14 pulg.Distribucin de FrecuenciasSi se renen grandes cantidades de datos sueltos es til distribuirlos en clases o categoras, y determinar el nmero de individuos que pertenecen a cada categora, a lo que se le llama frecuencia de clase. A una distribucin tabular de los datos por clases, con sus correspondientes frecuencias de clase, se le conoce como distribucin de frecuencias o tabla de frecuencias. La tabla 1 es una distribucin de frecuencias de las estaturas de 100 estudiantes hombres de la universidad X.La primera clase (o categora), por ejemplo, comprende las estaturas entre 60 y 62 pulg y se indica con el rango 60-62. Como hay cinco estudiantes en esta clase, la correspondiente frecuencia de clase es 5.A los datos as organizados y reunidos en clases, como en la anterior distribucin de frecuencias, se les llama datos agrupados. Aunque el proceso de agrupamiento generalmente quita detalles originales de los datos, es muy ventajosa pues proporciona una visin amplia y clara, adems de que se obtienen relaciones evidentes.1.3.2. Tipos de frecuenciasFrecuencia absolutaLa frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

La frecuencia relativaLa frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1.

Frecuencia acumuladaLa frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi.Ejemplo:Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.XiRecuentofiFini

27I110.032

28II230.065

29IIIII I690.194

30IIIII II7160.226

31IIIII III8240.258

32III3270.097

33III3300.097

34I1310.032

311

ACTIVIDAD 1CALIFICACIN:FECHA:

Nombre:

1.- El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto de la dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos, y ha obtenido los siguientes datos:0011112222222222222222222

2233333333333333344444456

Se pide:a. Construir la tabla de frecuencias.b. Cul es el nmero de familias que tiene como mximo dos hijos?c. Cuntas familias tienen ms de 1 hijo pero como mximo 3?d. Qu porcentaje de familias tiene ms de 3 hijos?

1.4. Representaciones grficas1.4.1. Diagrama de barrasUn diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia.Ejemplo:Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el siguiente resultado:Grupo sanguneofi

A6

B4

AB1

O9

20

1.4.2. Polgonos de frecuenciaUn polgono de frecuencias se forma uniendo los extremos de las barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos.Ejemplo:Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones:HoraTemperatura (C)

67

912

1214

1511

1812

2110

288

1.4.3. Diagrama de Sectores

Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente. Ejemplo:En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 9 juegan al ftbol y el resto no practica ningn deporte.ALUMNOSNGULO

BALONCESTO12144

NATACIN336

FTBOL9108

SIN DEPORTE672

TOTAL30

ACTIVIDAD 3CALIFICACIN:FECHA:

Nombre:

1.- Elabore el diagrama de barra y el del polgono de frecuencias de las frecuencias absolutas del siguiente ejercicio (realizado en la actividad 2).El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto de la dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos, y ha obtenido los siguientes datos:0, 0,1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 6

2.- A partir de los siguientes datos que corresponden a una encuesta referente a elecciones locales de un partido poltico, construye un diagrama de sectores:

Xifi

A favor50%

En contra40%

Abstencin10%

3.- Los siguientes datos representan los ingresos diarios (en miles) de 20 obreros de cierta compaa.16, 16, 17, 18, 18, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 22, 22, 23, 23, 24.a) Construya una tabla de frecuencias b) Construya un diagrama de barra

4.- De acuerdo a un sondeo a egresados de la Facultad de Administracin y Negocios de la Universidad del Sur de California (USC) de Los ngeles, los siguientes datos representan el nmero de egresados por especialidad. Construir un diagrama de sectores.

ESPECIALIDADGRADUADOS

CONTADOR FISCAL73

FINANZAS52

GERENCIA36

MERCADOTECNIA64

OTROS28

1.5. Distribucin de frecuencias agrupada en intervalo1.5.1. Procedimiento1.- Determinar el mximo y mnimo entre los valores que tenemos en la muestra y calcular el recorrido de la variable o rango, es decir, R=Xmax-Xmin.2.- Calcular el nmero de intervalos de clase a utilizar. Existen diversos criterios para determinar el nmero de intervalos de clases. Sin embargo, es de gran utilidad utilizar el mtodo sugerido por Hebert A. Sturges, el cual establece que: K (nmeros de intervalos) = 1+3,322 log(N).

3.- Determinamos la amplitud o tamao de los intervalos atravs de la siguiente formula: = ancho o tamao del intervalo.Ejemplo: Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de pesos) fueron:

Procedimiento:1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.2.- K= 1+3,322 log (40) = 6.3 6 nmeros de intervalos3.- Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalosAs pues la tabla sera:

Intervalos fiFihi

[3.3,3.8)330.075

[3.8,4.3)8110.2

[4.3,4.8)14250.35

[4.8,5.3)6310.15

[5.3,5.8)4350.1

[5.8,6.3)5400.125

1CEYA 7mo SEMESTRE