curso de estdistica hecho por mi

30
UNIVERSIDAD CATÓLICA REDEMPTORIS MATER Escuela de Ciencias de la Educación _________________________________________________________________________________ _________________ UNIVERSIDAD CATÓLICA REDEMPTORIS MATER Facultad de Humanidades Escuela de Ciencias de la Educación ESTADISTICA GENERAL (Licenciatura en Pedagogía) Autor: Lic. José Martín Pereira Ortega _________________________________________________________________________________ _________________ ESTADISTICA GENERAL pág.1 Lic. José Martín Pereira ortega

Upload: jose-martin-pereira-de-rodriguez

Post on 17-Sep-2015

220 views

Category:

Documents


3 download

DESCRIPTION

Curso de Estdistica Hecho Por Mi

TRANSCRIPT

UNIVERSIDAD CATLICA REDEMPTORIS MATEREscuela de Ciencias de la Educacin__________________________________________________________________________________________________UNIVERSIDAD CATLICA REDEMPTORIS MATERFacultad de HumanidadesEscuela de Ciencias de la Educacin

ESTADISTICA GENERAL(Licenciatura en Pedagoga)Autor: Lic. Jos Martn Pereira Ortega

ESTADISTICA GENERAL

(Licenciatura en Pedagoga)

OBJETIVO GENERAL DEL CURSO.Analizar, presentar y aplicar conceptos y tcnicas de la probabilidad y estadstica descriptiva para procesar e interpretar la informacin obtenida en estudios realizados sobre la Psicologa humana en ambientes escolares, laborales, etc.

CONTENIDOI. El papel de la estadstica y administracin1.1 Naturaleza y objetivos de la investigacin.1.2 Estadstica descriptiva e inferencial.1.3 Estadstica e investigacin.1.4 Aplicaciones de la Estadstica a la investigacin. 1.5 Tipos de aplicaciones en la administracin y economa. 1.6 Conceptos Bsicos: datos, muestra, poblacin, estadgrafa, parmetro.

II. Descripcin y resumen de datos.

2.1 Obtencin de datos. 2.2 Tabulacin de datos cuantitativos: la tabla de distribucin de frecuencias.2.3 Histograma, diagramas circulares, ojiva y polgono de frecuencias.2.4 Medidas de tendencia central y medidas de dispersin.

III. Probabilidad Bsica.

3.1 Conceptos bsicos de probabilidad: subjetiva y objetiva.3.2 Propiedades de la probabilidad.3.3 Probabilidad condicional.3.4 Reglas de conteo.

IV. La Distribucin Normal

4.1 Importancia de la distribucin Normal.4.2 Distribucin normal Estndar: Uso de tabla.4.3 Estandarizacin de una distribucin normal.4.4 Aplicaciones de la distribucin normal.Bibliografa

1.Texto BsicoJohnson Robert. Estadstica Elemental. Grupo Editorial. Ibero Amrica 1990.

2. Textos ComplementariosPortus 5 Lincoya. Curso Prctico de Estadstica. McGraw-Hill 1998.Kazmier J. Leonel. Estadstica aplicada a la administracin y Economa. Schaum. 1990Hopkins D. Kenneth. Estadstica Bsica para las ciencias sociales y del comportamiento. McGraw-Hill Wayne W. Daniel. Estadstica con aplicaciones a las ciencias sociales y a la educacin. McGraw-Hill 1991.

UNIDAD I: El papel de la estadstica y administracin1.1 Naturaleza y objetivos de la investigacin.HISTORIA DE LA ESTADISTICAComo dijera Huntsberger: "La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, crditos y as sucesivamente. Huntsberger tiene razn pues al instante de escuchar esta palabra estas son las imgenes que llegan a nuestra cabeza.

La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias. Los mercados, la medicina, la ingeniera, los gobiernos, etc. Se nombran entre los ms destacados clientes de sta.

La ausencia de sta conllevara a un caos generalizado, dejando a los administradores y ejecutivos sin informacin vital a la hora de tomar decisiones en tiempos de incertidumbre.

La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los trabajos matemticos de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri a la Estadstica a las ciencias formales.

Los orgenes de la estadstica, aunque no se sabe con exactitud cundo se comenz a utilizar, pueden estar ligados al antiguo Egipto como a los censos chinos que se realizaron hace unos 4.000 aos, aproximadamente.Sin duda, fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron ocupar la estadstica. Cada cinco aos realizaban un censo de la poblacin, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales para estudiar los avances del imperio; sin olvidar los recuentos de ganado y las riquezas que dejaban las tierras.Desde esa poca, diversos estados realizaron estudios sobre algunas caractersticas de sus poblaciones, sus riquezas, posesiones, etc.En 1662, John Graunt (1620 1674), un mercader ingls, public un libro sobre los nacimientos y defunciones ocurridos en Londres; el libro contena conclusiones acerca de ciertos aspectos relacionados con estos acontecimientos. Esta obra es considerada como el punto de partida de la estadstica modernaLa palabra estadstica comenz a usarse en el siglo XVIII, en Alemania, en relacin a estudios donde los grandes nmeros, que representaban datos, eran de importancia para el estado. Sin embargo, la estadstica moderna se desarroll en el siglo XX a partir de los estudios de Karl Pearson.Hoy, la estadstica tiene importancia no solo porque presenta informacin, sino que adems permite inferir y predecir lo que va a ocurrir, y por lo tanto, es una herramienta fundamental a la hora de tomar decisiones de importancia.

Definicin de EstadsticaLa Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con e fin de realizar una toma de decisin ms efectiva.

Utilidad e ImportanciaLos mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas descriptivas. Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones.

EJERCICIO 1:1. Averigua en qu parte del libro Nmeros, del Antiguo Testamento, se hace referencia a censos o recuentos estadsticos. Qu semejanzas hay con los censos actuales?2. Qu importante acontecimiento relacionado con la estadstica marc el momento del nacimiento de Cristo?3. En tu vida diaria, cundo usas la estadstica para informarte? Cundo lo haces para tomar decisiones?4. Por qu crees t que la estadstica demor tanto tiempo en desarrollarse?5. Seala 4 reas distintas en las cuales se utilice la estadstica como herramienta de investigacin.

1.2 Estadstica descriptiva e inferencial.CONCEPTOS BASICOS:El Instituto Nacional de Estadsticas y Censos, (INEC), es el organismo encargado de recoger, de forma fidedigna y oportuna, informacin relevante para la administracin del Estado y para las actividades nacionales, con el objetivo de mejorar la calidad de vida de las personas.El estudio de la estadstica se ha concretado primordialmente en el anlisis de datos y su aplicacin en la toma de decisiones, lo que ha permitido dividir a la estadstica en: Estadstica descriptiva Inferencia estadstica (estadstica inductiva o estadstica analtica).

ESTADSTICA DESCRIPTIVA: Es el proceso que se relaciona con los mtodos y/o tcnicas para la recopilacin, organizacin y anlisis de un conjunto de datos cuantitativos, con el objeto de describir en forma apropiada las diversas caractersticas de dicho conjunto.

INFERENCIA ESTADSTICA: Es la tcnica o metodologa mediante la cual es posible realizar la estimacin de las caractersticas de una poblacin o realizar la toma de decisiones basados en resultados muestrales.

1.3 Estadstica e investigacin.

PASOS PARA EFECTUAR UN ESTUDIO ESTADSTICO

El uso de los mtodos estadsticos es muy variado y se aplican generalmente a distintos campos como son los negocios, economa, educacin, medicina, ingeniera, etc. Para lo cual el proceso para realizar un estudio estadstico est constituido de las siguientes etapas:

1. Formulacin del problema: Para realizar el estudio de un problema es necesario delimitarlo y formularlo adecuadamente, definindolo de manera clara y precisa.

2. Diseo del experimento: Esta etapa se basa primordialmente en obtener un mximo de informacin empleando un mnimo de costo y tiempo.

3. Recopilacin de datos: Los datos provienen de observaciones reales o de documentos que se usan de manera cotidiana, es la parte que consume mayor tiempo la cual la podemos obtener de: a. Bancos de datos b. Entrevistas o cuestionarios c. Observacin directa o mediciones experimentales

4. Organizacin y descripcin: Consiste en desglosar los datos en algunas propiedades sencillas, se incluye el problema de elaborar modelos matemticos apropiados de los datos.

5. Inferencia estadstica: Consiste en obtener conclusiones acerca de la poblacin muestreada que dio lugar a los datos recopilados, es el principal objetivo de las investigaciones estadsticas.

6. Interpretacin y decisin: Consiste en la fase final del estudio la cual determinar si una solucin es adecuada o no, dependiendo de los resultados obtenidos.

1.4 Aplicaciones de la Estadstica a la investigacin. 1.5 Tipos de aplicaciones en la administracin y economa.OBTENCIN DE DATOS Dentro de un proceso de investigacin una de las actividades que se realizan es la recopilacin de datos, la cual es el acopio de informacin y se incluye desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios con el empleo de tcnicas de muestreo. Existe una gran variedad de tcnicas para realizar la investigacin, que se debern seleccionar de acuerdo a las necesidades del problema, as como a diferentes factores como son el tiempo, costo, tipo de actividades a realizar, recursos humanos, etc.

Las tcnicas de recopilacin de datos las podemos realizar con: Investigacin documental Investigacin de campoLA INVESTIGACIN DE CAMPO: Consiste en obtener informacin directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar as como las personas relacionadas y se puede realizar: a) Por observacin directa b) Por interrogacin

LA OBSERVACION: Es el procedimiento emprico bsico, el cual consiste en realizar la percepcin intencionada de una actividad determinada mediante la experimentacin la cual consiste en la obtencin de datos cuantitativos por medio de la medicin del fenmeno que se este observando. Para realizar la observacin se utilizan diversos instrumentos auxiliares los cuales son: 1.- La ficha de campo 3.- La entrevista 2.- Estudio de Actividades 4.- La encuesta realizadas con anterioridad, biografas, etc.

LA ENTREVISTA: Es una de las tcnicas ms comunes y es considerada como la relacin directa entre el investigador y el objeto de estudio a travs de individuos o grupos con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales LA ENCUESTA: Consiste en recopilar informacin sobre una parte e la poblacin, en donde la informacin recopilada puede emplearse para un anlisis cuantitativo con el fin de identificar las magnitudes del problema. a) Un cuestionario b) Una cedula de entrevista EL CUESTIONARIO: Es un eficaz auxiliar en la observacin cientfica que contiene aspectos del fenmeno esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador. Cuestionarios por correo Cuestionario administrado por el entrevistado Cuestionario administrado por el entrevistador LA CEDULA: Tiene carcter de annimo, donde el encuestador es quien llena la cedula de entrevista, adems de que es posible aclara la informacin sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.

1.6 Conceptos Bsicos: datos, muestra, poblacin, estadgrafa, parmetro.

DEFINICIONES

Poblacin: es un conjunto de personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una caracterstica en comn.Muestra: es un subconjunto cualesquiera de la poblacin; es importante escoger la muestra en forma aleatoria (al azar), pues as se logra que sea representativa y se puedan obtener conclusiones ms afines acerca de las caractersticas de la poblacin.

Para estudiar alguna caracterstica especfica de la poblacin se pueden definir los siguientes tipos de variables:

Cualitativas: Tambin llamadas atributos, y se refieren a cualidades tales como: calidad (bueno, regular, malo), sexo, color del pelo o de los ojos, estado civil, nivel escolaridad, etc.

Cuantitativas: Se refieren a cantidades tales como costos, estaturas, pesos, ingresos, nmero de hijos, etc. A la vez, se distinguen dos tipos de datos o variables cuantitativos:

Variables Discretas: Son aquellas que tienen valores prohibidos dentro de su intervalo de definicin, o sea, toman valores determinados, predefinido. Generalmente representan valores enteros asociados a observaciones susceptibles de conteo.

Variables Continuas: Son aquellas que pueden tomar cualquier valor dentro de su intervalo de definicin. Generalmente representan observaciones susceptibles de medicin. Es importante tener en cuenta que la continuidad est dada por la propia naturaleza de variable, no porque sta se exprese con valores decimales o no, pues esto es algo que depende de las unidades de medida utilizadas, de la precisin deseada o de costumbres al expresar una magnitud.

EJERCICIO 2:

INSTRUCCIONES: Lee cuidadosamente y responde los siguientes cuestionamientos, rellenando el crculo de la opcin que consideres correcta.

1. Rama de las matemticas en donde a travs de un conjunto de metodologas se puede observar el comportamiento de un experimento o fenmeno y da una conclusin acertada.a) Estadsticab) Estadstica diferencialc) Estadstica inferenciald) Estadstica aplicada2. Cules son las dos clasificaciones de la estadstica?a) Inferencial y aplicadab) Aplicada diferencialc) Descriptiva e inferenciald) Descriptiva y diferencial.3. Conjunto de datos cuya finalidad es suministrar informacin acerca de una poblacin en donde todos los elementos deben tener todas las caractersticas de la poblacin.a) Poblacinb) Muestrac) Estadsticad) Datos4. Tipo de variable al que se le puede asignar un valor numrico:a) Numricas o cuantitativasb) Categricas o cualitativasc) Numrica continuad) Cabalstica5. As se le llama al estudio que se hace de una poblacin por medios de muestras representativas que posea todas las caractersticas de una poblacin:a) Muestrab) Muestreoc) Experimentod) Organizar6. A continuacin se te proporciona una serie de variables estadsticas, clasifica cada una en discreta o continua segn corresponda.a) Peso.b) Promedio escolar.c) Estado civil.d) Semestre que cursa.e) Mes de nacimiento.f) Nmero de hermanos por alumno.g) Deporte favorito.h) Tiempo invertido al da en el chat.

UNIDAD II: Descripcin y resumen de datos.

2.1 Obtencin de datos.2.2 Tabulacin de datos cuantitativos: la tabla de distribucin de frecuencias.

TABULACIN DE DATOS (TABLAS DE FRECUENCIAS):

Segn la forma en que se presenta la informacin, se habla de:

Recoleccin simple o no organizada (datos no organizados): Es el listado de los datos presentados en su forma primaria, es decir, tal como fueron obtenidos durante el proceso observacin o medicin en la muestra o poblacin.

Recoleccin organizada o tabulacin (datos organizados): Es el ordenamiento de la informacin en tablas, denominadas tablas de frecuencias o distribuciones de frecuencias, a partir de los datos primarios. Cuando los datos se tabulan, o se organizan en las tablas de frecuencias, pueden estar no agrupados, es decir, de manera que se leen directamente los valores observados, o agrupados, esto es, se construyen intervalos para resumir la informacin observada.

Una clase se caracteriza por un valor que es su lmite inferior y otro que es su lmite superior. El promedio de los dos lmites, que muchas veces se toma como el valor representativo de la clase, es llamado marca de clase. Y a la diferencia o distancia entre los lmites de la clase se le llama ancho de clase: aunque no es obligatorio, es usual utilizar clases del mismo ancho siempre que es posible. (Si las clases no tienen el mismo ancho, no es la altura de las barras o rectngulos la que debe ser proporcional a las frecuencias representadas, sino su rea.)

La forma general de una tabla de frecuencias es la siguiente:

Li 1 ; LiXinIfiNiFi

L0 L1X1n1f1N1F1

L1 L2X2n2f2N2F2

. . . . . . . . . . . . . . . . . .

Lk-1 ; LkXknkfkNkFk

Los smbolos y definiciones correspondientes son: Xi: representa los valores individuales de la variable (en datos no agrupados) o las marcas de clase (en datos agrupados en clases)

Li-1- Li: representan las clases (si los datos se agruparon), delimitadas por los lmites de clase, el inferior (Li-1) y el superior (Li)

ni ( frecuencia absoluta ): nmero de veces que se repite el i-simo valor de la variable; donde ni= n n( tamao de la muestra ): cantidad de observaciones efectuadas, es decir, nmero de elementos contenidos en la muestra k: representa el nmero de valores diferentes observados (datos no agrupados) o la cantidad de clases creadas (datos agrupados)

Tambin pueden incorporarse a la tabla otras frecuencias, como:

fi( frecuencia relativa ): proporcin de veces que se repite el i-simo valor de la variable (si se multiplica por cien constituye un por ciento); se cumple que:

fi= ni/n y donde fi= 1

Ni( frecuencia absoluta acumulada ): Es el nmero de observaciones menores o iguales al isimo valor de la variable, donde N1= n1, N2= n1+ n2, N3= n1+ n2+ n3, y as sucesivamente hasta Nk= n. As, se interpreta como el nmero de observaciones menores o iguales al i-simo valor de la variable.

Fi( frecuencia relativa acumulada ): es la proporcin (o por ciento) de observaciones menores o iguales al i-simo valor de la variable, siendo F1= f1, F2= f1+ f2, F3= f1+ f2+ f3, y as sucesivamente hasta Fk= 1.

AGRUPACIN DE LOS DATOS EN CLASES:

La agrupacin de datos en clases incluye muchas cuestiones subjetivas, como facilidad o conveniencias de agrupacin, diversidad de criterios o necesidades de la investigacin; e incluso puede depender de la propia naturaleza de los datos.

Se debe considerar tambin que la agrupacin de datos siempre conlleva un grado de prdida de informacin, pues ya no se cuenta con todos y cada uno de los valores de la variable sino con los intervalos creados; no obstante, esta prdida de informacin en general no es significativa para el anlisis global.

Algunas de las formas en que se presentan los intervalos de clases son:

Caso A Caso B Caso C 10 14,9 10 15 10 15 15 19,9 15,1 20 15 20 20 24,9 20,1 25 20 25

Las variantes A y B se utilizan con el objetivo de que no se repita el mismo valor de un lmite de clase, de manera que para una observacin dada sea inequvoca (nica) la pertenencia a una clase; pero en cualquiera de los dos casos hay infinitos valores posibles entre el cierre de una clase y el inicio de la otra, es decir, entre 14,9 y 15 (caso A) y lo mismo entre 15 y 15,1 (caso B). Por ello muchos autores e investigadores prefieren la variante C, donde el valor que cierra una clase es el mismo que abre la siguiente, y se suele recurrir al siguiente convenio: cuando una observacin coincide con un lmite de clase se incluye en la clase donde dicho lmite es el lmite superior, es decir, se consideran los intervalos de clase como abiertos al inicio y cerrados al final, as: ( Li-1; Li]Los corchetes expresan que el valor extremo se incluye en el intervalo y losparntesis dan a entender que el valor extremo del intervalo no se incluye en el.

Los pasos que se deben dar para agrupar los valores observados segn el segundo mtodo pueden resumirse como sigue:

1. Determinar el rango o recorrido de la variable (R), definido como la diferencia entre el valor mximo y el mnimo de la variable: R = Dato mayor Dato menor R = Xmax- Xmin

2. Definir el nmero de intervalos o clases (k): La prctica indica que menos de 4 5 clases suele ser muy poco y que en general ms de 20 clases puede ser excesivo, es decir, ni tan pocos, que se pierda demasiada informacin, ni tantos que parezca que no se han agrupados los datos ( 4 k 20 )

a) Regla de Velleman k =

b) Regla de Sturges k = 1 + 3.3 log (n) c) Regla de Stockes k = + 1

3. Determinar la amplitud o ancho de estos intervalos (c), como el cociente del recorrido de los datos entre la cantidad de clases que se decidi usar, aproximado convenientemente y siempre por exceso: c =

4. Crear las clases, partiendo del valor mnimo observado (xmin) o un valor inferior, y sumando sucesivamente el ancho de clases (c) determinado.

5. Clasificar la variable en las distintas clases, para lo cual se puede hacer un tarjado, obteniendo las frecuencias absolutas correspondiente (ni).

6. Calcular las restantes frecuencias deseadas: relativas (fi), absolutas acumuladas (Ni) y relativas acumuladas (Fi).

7. Determinar las marcas de clases (Xi), valores que representarn a sus respectivas clases.Xi =

EJEMPLO1 (Datos no agrupados):

Se tiene los datos recopilados acerca de la variable X: nmero de ausencias a clase que tienen los estudiantes de un grupo.

0 1 2 2 1 3 2 1 4 2 4 3 2 0 0 2 2 3 0 3 Datos en su forma primaria (sin organizar)

Qu tipo de variable es esta?: Variable cuantitativa discreta.

Construccin de la tabla o distribucin de frecuencias:

Al tratarse de una variable discreta (un conteo siempre tomar valores enteros) y con pocos valores diferentes, no parece necesario crear clases para agrupar los datos.

En este caso k = 5 (son cinco los valores distintos de X: 0, 1, 2, 3 y 4).

Nmero deausenciasCantidad deestudiantesProporcin deestudiantes

XiniFiNiFi

040.2040.20

130.1570.35

270.35140.70

340.20180.90

420.10201.00

n = 201

Interpretacin de las distintas frecuencias:

ni indica las veces que se repite el valor de la variable, as: n1= 4 indica que hay 4 alumnos del grupo que no tienen ausencias. n3= 7 indica que hay 7 estudiantes del grupo que tienen 2 ausencias.

fi indica el porciento de veces que se repite el valor de la variable, as: f4 = 0.20 indica que el 20% de los estudiantes tienen 3 ausencias f5= 0.10 indica que el 10% de los estudiantes tienen 4 ausencias

Ni indica el nmero de observaciones menores o iguales al valor de la variable, as: N2= 7 indica que hay 7 estudiantes que tienen hasta (o como mximo) 1 ausencia N3= 18 indica que hay 18 estudiantes que tienen hasta 3 ausencias

Fi indica el porciento de observaciones menores o iguales al valor de la variable, as: F2= 0.35 indica que el 35% de los estudiantes tienen hasta 1 ausencia. F3= 0.70 indica que el 70% de los estudiantes tienen hasta 2 ausencias.

EJEMPLO 2 (Datos agrupados):

Los siguientes valores corresponden al registro del consumo de gasolina de una flota de 50 taxis, en litros, un da dado:

46 39 34 33 32 36 41 26 32 36 43 28 30 27 32 42 30 31 34 41 28 30 26 21 37 39 25 33 47 28 26 23 30 43 40 36 21 38 31 38 29 30 48 47 23 31 24 38 35 36

Qu tipo de variable es sta? Aunque los datos observados son todos enteros la variable es continua, por su propia naturaleza (de hecho, un taxi podra haber consumido 24,75 litros de gasolina).

Se tiene n = 50 taxis (tamao de la muestra).

Determinacin del recorrido: R = Xmax- Xmin= 48 - 21 = 27

Definicin del nmero de clases a usar: Para 50 observaciones podran usarse 5, 6,7 u 8 clases, segn decisin de quien va a organizar los datos. Sea en este caso k = 6.

Determinacin del ancho de clases: c R/k R/k = 27/6 = 4,5 5 c = 5 (El valor R/k = 4,5 se redondea a 5 porque no tendra sentido en este caso hacer los intervalos de amplitud decimal, ya que complicara, en vez de facilitar, la interpretacin y el trabajo con la informacin; ntese que esta aproximacin fue a un valor superior al verdadero cociente, es decir, por exceso.)

Creacin de las clases: Se podra partir del valor Xmin= 21, pero resulta ms cmodo comenzar ligeramente por debajo de l, en 20, de manera que la primera clase sea desde 20 a 20 + c (ya se tiene c = 5), o sea, de 20 a 25; la segunda de 25 a 30, sin incluir el 25 (lmite inferior y extremo abierto) e incluyendo el 30 (lmite superior y extremo cerrado), y as sucesivamente hasta la sexta clase (k = 6), que sera desde 45 (extremo abierto) a 50 (extremo cerrado).

Determinacin de las marcas de clases (Xi): Siendo el promedio de los lmites de clase se tiene que: Xi= (Li Li-1)/2 As: X1= (20 + 25)/2 = 45/2 = 22,5 X2= (25 + 30)/2 = 55/2 = 25,5 X2= X1+ c Y as sucesivamente

Clasificacin de la variable y clculo de las distintas frecuencias: Para ello se puede hacer previamente un tarjado Se debe tener en cuenta, adems, el convenio de que si una observacin coincide con un lmite de clase, se incluye en la clase donde dicho lmite est como lmite superior; as todos los taxis que consumieron 30 litros de gasolina se incluyen en la clase de 25 a 30, no en la que va de 30 a 35.

ClasesMarca de claseFrecuenciaabsolutaFrecuenciarelativaFrecuenciaacumuladaFrecuenciaAcumuladarelativa

(Li -1; Li]XinifiNiFi

20 2522.560.1260.12

25 3027.5130.26190.38

30 3532.5110.22300.60

35 4037.5110.22410.82

40 4542.550.10460.92

45 5047.540.08501.00

n = 201.00

Interpretacin de las distintas frecuencias:

n2= 13: indica que hay 13 taxis que consumieron entre 25 y 30 litros de gasolina, o que consumieron como promedio 27,5 litros (utilizando la marca de clases)

f3= 0,22: indica que el 22% de los taxis consumieron entre 30 y 35 litros de gasolina, o que consumieron 32,5 litros como promedio.

N4= 41: indica que 41 taxis consumieron HASTA 40 litros de gasolina, o un mximo de 40 litros. (Las frecuencias acumuladas se interpretan utilizando el lmite superior del intervalo, nunca con la marca de clases.)

F5= 0,92: indica que el 92% de los taxis consumi HASTA 45 litros de gasolina, o un mximo de 45 litros.

EJERCICIO 3: Construye la tabla o distribucin de frecuencias para cada uno de los siguientes ejercicios.1. Cierta universidad realiz un experimento sobre el coeficiente intelectual (C.I.) de sus alumnos, para lo cual aplic un examen de C.I. a un grupo de 20 alumnos escogidos al azar, obteniendo los siguientes resultados:119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106.

2. A partir de los siguientes datos, que representan el nmero de habitaciones de 50 viviendas del barrio San Ignacio, que se estn visitando para estudiar el grado de hacinamiento, construya una distribucin de frecuencias e interprete 3 frecuencias absolutas y relativas simples y 3 frecuencias absolutas y relativas acumuladas. 3 2 3 4 3 5 2 1 3 2 4 3 2 1 1 2 5 2 3 1 2 3 2 1 2 2 2 3 3 4 3 2 2 3 4 1 1 5 2 3 4 4 3 3 2 2 2 1 1 2

3. Un grupo de investigadores pertenecientes a la secretara de seguridad pblica, tom una muestra aleatoria de las velocidades (km/h) registradas por 30 vehculos en el trayecto Ticuantepe a Managua, con el fin de establecer nuevos lmites mximos de velocidad para una carretera. La muestra arroj los datos siguientes:90, 99, 104, 99, 119, 98, 95, 112, 95, 120, 100, 90, 116, 96, 114, 108, 98, 118, 100, 106, 114, 100, 112, 106, 100, 115, 111, 105, 114, 97.

4. El gerente de una compaa de ventas al mayoreo de diferentes tipos de mercancas desea conocer el comportamiento de las llamadas telefnicas durante los meses de agosto y septiembre del ao en curso; por lo que le encomienda a su secretaria que realice esa investigacin. La secretaria obtuvo los siguientes datos, en nmero de llamadas por da: 30, 38, 36, 35, 29, 28, 30, 35,40, 48, 50, 20, 25, 56, 30 27, 29, 46, 41, 31, 31, 31, 39,28, 36, 37, 52, 44, 49, 52 56, 58, 40, 39, 38, 40, 27, 24,30, 32, 35, 38, 26, 25, 24 60, 55, 48, 37, 31, 30, 22, 20,24, 26, 23, 22, 28, 27, 48

5. Al gerente general de la empresa Conductores Monterrey le interesa conocer la antigedad de sus trabajadores, por lo que le indica al gerente de personal que realice un anlisis del problema. El gerente de personal recab de los expedientes la siguiente informacin sobre los aos de antigedad: 13, 19, 22, 14, 13, 16, 19, 21 23, 11, 27, 25, 17, 17, 13, 20 23, 17, 26, 20, 24, 15, 20, 21 23, 17, 29, 17, 19, 14, 20, 20 10, 22, 18, 25, 16, 23, 19, 20 21, 17, 18, 24, 21, 20, 19, 26

2.3 Histograma, diagramas circulares, ojiva y polgono de frecuencias.

REPRESENTACION GRFICA

Al representar en una grfica la informacin concentrada en la tabla de frecuencias, sta es un recurso visual que nos permite tener una idea clara, precisa, global y rpida acerca de las observaciones de una muestra o poblacin. Existen muchos tipos de grficas en las que se pueden representar la frecuencia absoluta (fi), relativa (fr) y acumulada (Fi) y con ellas podemos estimar algunos valores con la simple observacin.

Los diferentes tipos de grfica que podemos usar para representar las observaciones de un determinado problema y la seleccin de este tipo, dependen de la variable en estudio. Si la variable en estudio es del tipo cualitativo, los grficos pueden ser: a) De barras; horizontales o verticales. b) Circulares. c) Pictogramas, etctera.

Si la variable en estudio es de tipo cuantitativo, los grficos que podemos usar para su representacin grfica son: a) Histogramas. b) Polgonos de frecuencias que a continuacin analizaremos.

Grfica de Barras:

Es un mtodo grfico que consta de dos ejes: Uno horizontal, en el que se representan los valores (Eje de los datos) utilizando barras verticales en forma rectangular y de la misma amplitud, y un eje vertical, en el cual la frecuencia representa la altitud que tendr la barra rectangular (Eje de las frecuencias), las barras van separadas la misma distancia unas de otras y para distinguirlaspuede utilizarse distintos colores o entramados segn se considere.

Ejemplo: Utilizando los datos del ejemplo 2.1.4.

Grfica Circular de Pastel:

Este grfico se utiliza fundamentalmente, para representar distribuciones de frecuencias relativas (es decir, porcentajes % o proporciones) haciendo corresponder la medida de la frecuencia relativa con la medida del ngulo en grados; es decir, si el 100 % de los datos son 360 de la circunferencia, a cada 1% le correspondern 3.6; as, para obtener la medida del ngulo del sector, multiplicamos la frecuencia correspondiente por 3.6. Al utilizar este grfico se aconseja no sobrepasar los 10 elementos, y ordenar los sectores de acuerdo a una de dos formas, ya sea siguiendo el orden que se les d a los datos o empezando del mayor al menor segmento, iniciando a partir de las 12 horas y en el sentido de las manecillas del reloj. Por ltimo, si el texto que representa cada sector no puede colocarse dentro del mismo, se elabora una leyenda que se coloca fuera del segmento, unidos por una flecha.

Ejemplo: Utilizando los datos del ejemplo 2.1.1

Histograma:

Es una grfica en forma de barras que consta de dos ejes, uno horizontal, llamado eje de la variable en observacin , en donde situamos la base de una serie de rectngulos o barras contiguas; es decir, que no van separadas, y que se rotula con los lmites inferiores de cada clase o intervalo excepto el ltimo que deber llevar tambin el lmite superior, centradas en la marca de clase. Y un eje vertical llamado eje de las frecuencias, en donde se miden las alturas que vienen dadas por la frecuencia del intervalo que representa. Todos los intervalos deben tener la misma longitud.

Vemoslo a travs de un ejemplo, cuando las amplitudes de los intervalos son iguales:

Ejemplo: Considerando los datos del ejemplo 2.1.4. Velocidades en una Carretera UrbanaPolgono de Frecuencias:

Es una grfica del tipo de las grficas de lneas trazadas sobre las marcas de clase, (de ah el nombre de polgono), y se traza uniendo con segmentos de recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar como abscisa la marca de clase (eje horizontal) y como ordenada la frecuencia del intervalo representado (eje vertical); la primera y ltima parejas ordenadas se unen mediante un segmento de recta al eje horizontal, con las que seran la marca de clase anterior y posterior respectivamente si estas existieran.

Este tipo de grfico adquiere mayor importancia cuando se quiere mostrar en un mismo grfico ms de una distribucin o una clasificacin cruzada de una variable continua con una discreta, situacin que no se puede observar en uno de los grficos presentados anteriormente por la forma de construccin del mismo grfico.

Ejemplo: Considerando los datos del ejemplo 2.1.4.

Velocidades en el Tramo carretero Ticuantepe-Managua

EJERCICIO 4: Con los datos del ejercicio 3, Construye los cuatro tipos de grficos.

2.4 Medidas de tendencia central y medidas de dispersin.

Las medidas de tendencia central, de centralizacin o posicin facilitan la interpretacin de informacin sobre un conjunto o serie de datos que se estn analizando, una vez que estos datos fueron recopilados u organizados, ya sea en una investigacin documental o en una investigacin de campo. Normalmente, la variable que se intenta medir es conocida en algunas ocasiones de manera insuficiente. Esto no significa que no se tenga algn conocimiento global de valores que pueda asumir, sino que es necesario conocerla mejor para tomar alguna decisin de importancia.

Por ejemplo, si se desea comparar las estaturas de alumnos varones de dos planteles del Colegio de Bachilleres del quinto semestre, y al tomar las medidas, se encontraran las variables entre 140 a 210 cm. Este conocimiento no es lo suficientemente preciso para hacer la comparacin deseada, es indispensable afinarlo ms para cada uno de los dos planteles, interesa donde estn centradas las estaturas, que tanta variabilidad tiene, etc. De los muchos aspectos de los datos, que intentamos representar numricamente con estadsticas, dos son los ms importantes:

a) Media Aritmtica o promedio (x)

b) Mediana x~

c) Moda )

__________________________________________________________________________________________________

ESTADISTICA GENERALpg.1Lic. Jos Martn Pereira ortega