programa desarrollado...eb cambios mayo2010

59
1 Educación Superior Abierta y a Distancia • Primer Cuatrimestre Estadística básica PROGRAMA DESARROLLADO SECRETARÍA DE EDUCACIÓN PÚBLICA Alonso Lujambio Irazábal SUBSECRETARÍA DE EDUCACIÓN SUPERIOR Rodolfo Tuirán Guérrez PROGRAMA DE EDUCACIÓN SUPERIOR ABIERTA Y A DISTANCIA COORDINACIÓN GENERAL Manuel Quintero Quintero COORDINACIÓN ACADÉMICA Soila del Carmen López Cuevas DISEÑO INSTRUCCIONAL Eloísa Alpízar Gómez EVALUACIÓN Y ACREDITACIÓN DE PROGRAMAS EDUCATIVOS Alicia Pérez Godínez DISEÑO GRÁFICO DE CONTENIDOS Y COMUNICACIÓN INSTITUCIONAL Paulina López Barrios ACCESIBILIDAD César Palvacini y Javier Bustos AGRADECEMOS LA COLABORACIÓN EN EL DESARROLLO DE ESTE MATERIAL A: Dr. Abelardo Mercado Herrera de la Universidad Politécnica de Baja California Y MUY ESPECIALMENTE A: Mtra. Elsa Marlene Escobar Crisani Secretaría de Educación Pública, 2010

Upload: sarai470

Post on 27-Jun-2015

5.906 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Programa Desarrollado...EB Cambios Mayo2010

1Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

SECRETARÍA DE EDUCACIÓN PÚBLICA

Alonso Lujambio Irazábal

SUBSECRETARÍA DE EDUCACIÓN SUPERIOR

Rodolfo Tuirán Gutiérrez

PROGRAMA DE EDUCACIÓN SUPERIOR ABIERTA Y A DISTANCIA

COORDINACIÓN GENERAL

Manuel Quintero Quintero

COORDINACIÓN ACADÉMICA

Soila del Carmen López Cuevas

DISEÑO INSTRUCCIONAL

Eloísa Alpízar Gómez

EVALUACIÓN Y ACREDITACIÓN DE PROGRAMAS EDUCATIVOS

Alicia Pérez Godínez

DISEÑO GRÁFICO DE CONTENIDOS Y COMUNICACIÓN INSTITUCIONAL

Paulina López Barrios

ACCESIBILIDAD

César Palvacini y Javier Bustos

AGRADECEMOS LA COLABORACIÓN EN EL DESARROLLO DE ESTE MATERIAL A:

Dr. Abelardo Mercado Herrera de la Universidad Politécnica de Baja California

Y MUY ESPECIALMENTE A:

Mtra. Elsa Marlene Escobar Cristiani

Secretaría de Educación Pública, 2010

Page 2: Programa Desarrollado...EB Cambios Mayo2010

2 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

ÍNDICE

I. INFORMACIÓN GENERAL DE LA ASIGNATURA

a. Ficha de identificación

b. Descripción

c. Propósito

II. COMPETENCIAS A DESARROLLAR

III. TEMARIO

IV. METODOLOGÍA DE TRABAJO

V. EVALUACIÓN

VI. MATERIAL DE APOYO

VII. DESARROLLO DE CONTENIDOS POR UNIDAD

a. UNIDAD 1

b. UNIDAD 2

c. UNIDAD 3

d. UNIDAD 4

VIII. CALENDARIO DE ACTIVIDADES

Page 3: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

3Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Presentación

I. INFORMACIÓN GENERAL DE LA ASIGNATURA

a. Ficha de identificación

b. Descripción

En un mundo cada vez más competitivo, tanto en las áreas comerciales, financieras, tecnológicas y científicas, y donde invariablemente el flujo de información es mayor a cada momento, se hace indispensable no sólo la correcta descripción de los datos sino también su análisis e interpretación. Es aquí donde la estadística juega un papel preponderante, al ser una de las herramientas más poderosas para comprender la variabilidad inherente a los datos observados y se constituye como la mejor herramienta para la toma de decisiones.

La diversidad de conocimientos, habilidades, actitudes, creencias y valores, requeridos en cada una de las carreras que ofrece la ESAD, hace necesaria la conformación de un tronco básico que, por un lado, garantice la formación integral en los atributos generales deseables de los estudiantes, y por el otro, derive, de manera natural, en los atributos particulares necesarios para cada disciplina de estudio.

El tronco básico se conforma de varias asignaturas comunes que promueven, por un lado, la formación integral de los estudiantes, integrando asignaturas de distintas áreas del conocimiento, y por otro lado, desarrollan en el estudiante competencias transversales necesarias para la investigación, el análisis crítico, el manejo y la sistematización de información y datos, así como una serie de valores que le permitan conducirse con ética y responsabilidad durante su trayectoria académica y su desempeño profesional.

Las materias que forman el tronco básico son: Contexto socioeconómico de México, Desarrollo humano, Estadística básica y Fundamentos de investigación; estas materias a simple vista parecen desarticuladas, pero se interrelacionan para contribuir a la formación integral de los estudiantes.

En relación al tronco básico la asignatura Estadística básica tiene varios propósitos, pues pretende despertar en el estudiante el interés por la investigación para la toma de decisiones, la solución de problemas y el análisis de situaciones y eventos relacionados con el entorno académico, profesional, personal y social, rigiéndose en todo momento por un código de ética profesional y personal.

Nombre de la Licenciatura o Ingeniería Primer cuatrimestre de asignaturas comunes

Nombre del curso o asignatura Estadística básica

Clave de asignatura -Seriación Sin seriación

Cuatrimestre 1Horas contempladas 90

Page 4: Programa Desarrollado...EB Cambios Mayo2010

4 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Los propósitos de la asignatura en relación al tronco básico son que los estudiantes:

1. Adquieran la capacidad de lectura e interpretación de tablas y gráficos estadísticos que con frecuencia aparecen en diferentes medios.

2. Lleguen a comprender y apreciar el papel de la estadística en la sociedad, incluyendo sus diferentes campos de aplicación y el modo en que la estadística ha contribuido a su desarrollo.

3. Identifiquen, dentro del contexto socioeconómico mexicano, la importancia y utilidad de los análisis estadísticos para la toma de decisiones.

4. Se conduzcan de manera ética y responsable en el manejo y análisis de la información.

De manera particular, la materia pone especial énfasis en el enfoque práctico del material y los contenidos que se presentan, tratando siempre de relacionar los conceptos, técnicas y casos de estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los estudiantes el deseo de adentrarse cada vez más a la teoría de la probabilidad y estadística, al ver lo importante que resulta su utilización en las diferentes áreas de trabajo.

La asignatura consta de cuatro unidades. En la primera unidad se estudian los fundamentos de la estadística, en la segunda las técnicas para representación gráfica y numérica de datos, en la tercera se abordan los conceptos básicos de la teoría de probabilidad como una medida del riesgo frente a la incertidumbre en experimentos aleatorios y la última unidad presenta el concepto de variables aleatorias y los modelos de probabilidad Binomial, Poisson y Normal.

c. Propósito

El curso tiene como propósito introducir al estudiante con los conceptos y técnicas básicas de la estadística aplicada a la licenciatura e ingeniería. El curso tiene un nivel matemático elemental, con la intención de que el estudiante comprenda la metodología y su aplicación, y no tanto la teoría matemática detrás de ella.

II. COMPETENCIAS A DESARROLLAR

Competencia general:

• Aplica procedimientos estadísticos y probabilísticos para analizar eventos en diferentes contextos, a través de la recolección, representación e interpretación de datos.

Competencias específicas:

• Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadístico.

• Aplica los parámetros de la estadística descriptiva para la representación gráfica y numérica de un conjunto de datos a través de muestras aleatorias simples.

• Identifica los conceptos básicos de probabilidad para la solución de problemas mediante experimentos aleatorios.

• Utiliza los modelos de probabilidad para el análisis de eventos y situaciones en diferentes contextos a través de experimentos aleatorios.

Page 5: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

5Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

III. TEMARIO

1. Fundamentos de la estadística 1.1 Introducción a la estadística 1.1.1 División de la estadística 1.2 Conceptos básicos de estadística 1.2.1 Población 1.2.2 Individuo 1.2.3 Muestra 1.2.4 Muestreo 1.2.5 Dato 1.2.6 Variable 1.2.7 Solución de un problema estadístico 1.3 Muestreo aleatorio 1.3.1 Conceptos básicos de muestreo aleatorio 1.3.2 Metodología del muestreo aleatorio simple

2. Estadística descriptiva 2.1 Organización de datos y distribución de frecuencias 2.1.1 Frecuencias 2.1.2 Intervalos 2.1.3 Construcción de intervalos de clase 2.1.4 Tablas de datos 2.1.5 Tablas de frecuencias 2.1.6 Tablas por intervalos de clase 2.1.7 Tablas de doble entrada 2.2 Representación gráfica de datos 2.2.1 Histograma 2.2.2 Gráfica de barras 2.2.3 Gráfica de líneas 2.2.4 Gráficas de área o de pastel 2.3 Medidas de tendencia central 2.3.1 Media aritmética 2.3.2 Mediana 2.3.3 Moda 2.4 Medidas de dispersión 2.4.1 Recorrido 2.4.2 Varianza 2.4.3 Desviación típica

Page 6: Programa Desarrollado...EB Cambios Mayo2010

6 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

3. Introducción a la teoría de probabilidad 3.1 Conceptos básicos de probabilidad 3.1.1 Incertidumbre 3.1.2 Probabilidad e incertidumbre 3.1.3 Probabilidad 3.1.4 Espacio muestral 3.1.4.1 Conjuntos 3.1.4.2 Operaciones básicas de conjuntos 3.1.5 Conjuntos y probabilidad 3.1.6 Evento 3.1.7 Tipos de espacios muestrales 3.1.7.1 Probabilidad en espacios muestrales discretos 3.1.8 Eventos dependientes e independientes y mutuamente excluyentes 3.2 Postulados de probabilidad 3.3 Reglas básicas de probabilidad 3.4 Probabilidad condicional 3.5 Experimentos aleatorios

4. Modelos de probabilidad 4.1 Variable aleatoria 4.1.1 Variables aleatorias continuas y discretas 4.1.2 Valor esperado 4.2 Distribuciones de probabilidad 4.3 Modelos de probabilidad 4.3.1 Modelo Binomial 4.3.2 Modelo Poisson 4.3.3 Modelo Normal

IV. METODOLOGÍA DE TRABAJO

Para el logro de la competencia, es fundamental que los conceptos y procedimientos presentados se ejerciten todo el tiempo, pues esperamos que los contenidos no sólo se comprendan sino que se apliquen en la solución de problemas que tengan que ver con situaciones que los estudiantes pueden enfrentar en su trayectoria académica y profesional.

Por lo anterior, las estrategias metodológicas de enseñanza-aprendizaje son, por un lado, el planteamiento de ejercicios y problemas tipo, de cada uno de los procedimientos que se abordan durante el curso, esto con el objetivo de que los estudiantes ejerciten en el uso, aplicación y manejo de formulas y contenidos procedimentales. Por otro lado, los facilitadores de la asignatura tendrán que orientar la aplicación de cada uno de estos procedimientos a las áreas específicas de interés de los estudiantes; es decir, dentro de la asignatura se trabajan los contenidos de manera aislada y los facilitadores tendrán que ejemplificar y presentar casos y situaciones aplicables en las diferentes carreras, que complementen los ejercicios que se están planteando.

Page 7: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

7Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Como estrategia de evaluación se utiliza un proyecto integrador, donde el estudiante haga uso de todo lo que se trabajó en el curso. Para esto, se les presentará a los estudiantes una serie de lineamientos generales que tendrán que seguir para realizar el trabajo, pero cada estudiante debe desarrollar el proyecto contextualizándolo en su campo de estudio y/o trabajo específico.

A lo largo del curso, se les presentarán a los estudiantes varia autoevaluaciones de carácter lúdico, esto con el fin de que puedan observar e identificar cuáles son sus avances y las dificultades que presentan en el aprendizaje de los temas. Estas autoevaluaciones contarán con una retroalimentación que sirva para reforzar los temas que se evalúan.

El facilitador juega un papel muy importante dentro del curso, pues se espera que sea quien dirija y oriente todo el proceso de aprendizaje. Deberá diseñar estrategias que propicien un aprendizaje verdaderamente significativo, facilitando la comprensión del contenido y relacionando éste con los conocimientos previos del estudiante así como con sus áreas específicas de estudio, a través del estudio casos y problemas relacionados con el hacer cotidiano donde los estudiantes puedan aplicar y ejercitar lo aprendido. Además de ser quien oriente las discusiones y sesiones de trabajo que se plantean en los espacios de aprendizaje colaborativo.

Su función durante la revisión de trabajos no es solamente evaluar el trabajo de los estudiantes y asignarles una calificación, se espera que utilice la evaluación como un proceso de revisión de los avances y/o dificultades que el estudiante presenta a la hora de trabajar los contenidos, que retroalimente a los alumnos con base en las observaciones de sus trabajos, participaciones, preguntas y/o dudas, con la finalidad de facilitar y propiciar el aprendizaje significativo y que desde esta perspectiva, haga del error una oportunidad para aprender.

Con el objetivo de promover el aprendizaje colaborativo, se utilizarán diferentes herramientas (foros, wikis, blogs, etc.) que propicien el intercambio, no sólo de información, sino de ideas entre los estudiantes; de tal forma que estos espacios sirvan para enriquecer el trabajo individual y colectivo, sirviendo como material de consulta y espacios de reflexión. Para ello se espera que los estudiantes participen de menara muy activa en estos espacios, motivados en todo momento por el facilitador, quien tendrá que fungir como moderador del trabajo que se realice en estos espacios.

V. EVALUACIÓN

Para aprobar la asignatura de Estadística Básica, se espera una participación responsable del alumno. Consciente de que el proceso de aprendizaje es su responsabilidad y de que puede contar con su facilitador para llevar este proceso.

Es requisito indispensable el cumplimiento de los entregables en todas y cada una de las unidades, dentro del tiempo especificado y conforme a las indicaciones dadas. La calificación obtenida será de acuerdo a la rúbrica, que el estudiante conocerá previamente.

Es también necesaria una actitud proactiva y de mucha interacción entre el alumno y su facilitador, a través de correos y foros de tal manera que el facilitador tenga una regencia clara de su desempeño. Para aprobar la asignatura, se debe de obtener la calificación mínima indicada por la ESAD.

Page 8: Programa Desarrollado...EB Cambios Mayo2010

8 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Los trabajos que se tomarán como evidencias de evaluación son:

Unidad 1:

• Muestra aleatoria simple

Unidad 2:

• Representación numérica y gráfica, bajo los parámetros de la estadística descriptiva, de la muestra aleatoria simple que entregó en la primera unidad. Esto incluye, tablas de frecuencias, medidas de tendencia central, medidas de dispersión y gráficas de diferentes tipos.

Unidad 3:

• Ejercicios de probabilidad en experimentos aleatorios

Unidad 4:

• Aplicación de los modelos de probabilidad en un problema.

Proyecto integrador:

• Solución de un problema general que requiere la aplicación de los procedimientos trabajos durante el curso.

Ponderaciones:

El trabajo en el aula virtual tiene un valor del 80% de la calificación final, el 20% restante, lo aporta el examen presencial. Las actividades que suman para la evaluación final del curso son:

ACTIVIDAD PORCENTAJE

Evidencia de la unidad 1 8%

Evidencia de la unidad 2 16%

Evidencia de la unidad 3 16%

Evidencia de la unidad 4 16%

Proyecto integrador 24%

Examen presencial 20%

Total 100%

VI. MATERIALES DE APOYO

Bibliografía básica:

• Douglas C. Montgomery, George C. Runger. Probabilidad y Estadística aplicadas a la ingeniería. Cuarta Edición, McGraw-Hill, México, 2006.

• Walpole Ronald E., Myers Raymond H. Probabilidad y Estadística para Ingenieros. Octava Edición, Editorial Pearson, México, 2007.

Page 9: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

9Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Bibliografía complementaria:

• Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. Estadística Matemática con Aplicaciones. Séptima Edición, Cengage Learning, México, 2010.

• Ferris Ritchey. Estadística aplicada a las ciencias sociales. Segunda Edición. Mc Graw Hill, 2008.• Douglas L., William M., Samuel W. Decimotercera Edición, Estadística aplicada a los negocios

y la economía, Mc Graw Hill, 2008.• Isabel Castillo Manrique, Estadística descriptiva y cálculo de probabilidades, Primera Edición,

Pearson Education de México, 2006.

Page 10: Programa Desarrollado...EB Cambios Mayo2010

10 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

VII. DESARROLLO DE CONTENIDOS POR UNIDAD

UNIDAD 1. FUNDAMENTOS DE ESTADÍSTICA

Propósitos de la unidad

En esta unidad:

• Identificarás los conceptos básicos relacionados con la Estadística. • Reconocerás la utilidad e importancia de la Estadística. • Aplicarás el procedimiento para obtener una muestra aleatoria simple.

Competencia específica

Aplica la metodología estadística para obtener una muestra aleatoria simple, identificando los elementos que intervienen en un problema estadístico.

Introducción

La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico.

En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos, así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple.

1.1 Introducción a la estadística

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.

Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística, en primer término se usa para referirse a la información estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se utilizan para analizar la información estadística; y el término estadístico, en singular y en masculino, se refiere a una medida derivada de una muestra.

Utilidad e Importancia

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto tiempo.

Page 11: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

11Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

En México, el Instituto Nacional de Estadística y Geografía (INEGI) se encarga de recabar información estadística y geográfica de todo el país, en diferentes áreas y contextos. Los datos que publica sirven para dar a conocer a cualquier persona la situación en la que se encuentra el área de donde se obtuvo la información. Al gobierno le son muy útiles para tomar decisiones, por ejemplo, para saber qué acciones se deben implementar en tal o cual zona del país, conocer los avances que se han registrado o como herramienta para la evaluación de un proyecto.

Los métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de conocimiento; tanto en el ámbito académico, como en el profesional y laboral.

1.1.1 División de la Estadística

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.

• Estadística Descriptiva: La función descriptiva de la estadística se enfoca en la presentación y clasificación de los datos obtenidos de la población que se analiza.

• Estadística Inferencial: Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra.

La estadística descriptiva describe datos.

La estadística inferencial infiere con esos datos, entendiendo inferir como la predicción de un resultado.

1.2 Conceptos básicos e importancia de la estadística

1.2.1 Población

Conjunto de todos los elementos que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc).

1.2.2 Individuo

Un individuo o unidad estadística es cada uno de los elementos que componen la población. Nota que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está formado por varias personas, es un individuo de la población.

1.2.3 Muestra

La mayoría de los estudios estadísticos se realiza, no a partir de toda la población, sino de un subconjunto o parte de ésta, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En general el tamaño de la muestra es mucho menor al tamaño de la población.

Page 12: Programa Desarrollado...EB Cambios Mayo2010

12 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

1.2.4 Muestreo

Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida y representativa de la población.

1.2.5 Variable

Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en cuantitativas y cualitativas:

a) Variable cuantitativa: se expresa en valores numéricos. Dentro de ella, se subdividen en:

• Discreta: Se tratan de variables expresadas con valores enteros. Ej. N° de hijos de una familia, n° de alumnos de un curso.

• Continua: son valores que pueden tomar cualquier valor dentro de un intervalo. Ej. Peso, estatura, sueldos.

b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en:

• Nominal: son variables presentadas sin orden ni jerarquía. Ej. Estado civil, preferencia por una marca, sexo, lugar de residencia.

• Ordinal: son variables organizadas de acuerdo con una clasificación. Ej. grado de estudios, días de la semana, calidad de la atención, nivel socioeconómico.

1.2.6 Solución de un problema estadístico

La solución de un problema estadístico comprende los siguientes pasos:

A) Planteamiento del problema.

En el planteamiento se define la población, la característica a estudiar (las variables), una hipótesis, etc. En este punto también se analizan los medios de los que se dispone y el procedimiento a seguir.

B) Elaboración de un modelo.

Se establece un modelo teórico de comportamiento de las variables de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo.

Los posibles modelos son Normal, Binomial, Poisson, Uniforme, etc. (estos modelos se estudiarán en la unidad 4).

C) Extracción de la muestra.

Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.

D) Tratamiento de los datos

En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media y la varianza de la muestra. Los métodos de esta etapa corresponden a los métodos de la estadística descriptiva.

Page 13: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

13Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Algunas de las etapas de esta fase son: recopilación, clasificación y presentación de la información.

E) Estimación de los parámetros

La estadística inferencial nos proporciona herramientas para la predicción o estimación de los parámetros de la población que nos ayudarán a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se obtienen del análisis de los datos y los intervalos de confianza.

1.3 Muestreo aleatorio

Introducción

Los estudios estadísticos normalmente se hacen con una parte de la población, ya que realizarlos sobre la totalidad resultaría demasiado complicado. Para que la información obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones específicas, relacionadas con el método para determinar el tamaño y características de la muestra y los individuos que la componen.

1.3.1 Conceptos básicos de muestreo aleatorio

Para que la información obtenida tenga validez y confiabilidad es necesario que cumpla con algunas condiciones específicas. Los métodos de muestreo se pueden clasificar en:

• Muestreo probabilístico: en él, todos los elementos de una población y, por lo tanto, todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestras obtenidas a través de este tipo de muestreo son confiables porque aseguran la condición de representatividad que es muy importante para hacer generalizaciones.

• Muestreo no probabilístico: en este tipo de muestreo los elementos de la población no comparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas no cumplen con la condición de representatividad, por lo que no es confiable hacer generalizaciones a toda la población.

1.3.2 Metodología del muestreo aleatorio simple

1. Definir la población de estudio y el parámetro a estudiar.

Recordemos que la población es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas características comunes observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar el que se va a estudiar.

Por ejemplo:

Un investigador realiza un estudio sobre las relaciones de género en el noviazgo, su objeto de estudio es las manifestaciones de violencia física y psicológica entre los estudiantes del último año de la carrera de química. Su población es el total de estudiantes del último año de ingeniería química que tengan novio o novia; el total de individuos con esta característica es de 386. Por lo que, la población es de 386 individuos y las variables son: violencia física y violencia psicológica.

Page 14: Programa Desarrollado...EB Cambios Mayo2010

14 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

2. Enumerar a todas las unidades de análisis que integran la población, asignándoles un número de identidad o identificación.

Una vez que hemos definido nuestra población y las variables a estudiar, es necesario asignar un número de identificación a cada individuo de la población.

Siguiendo con el ejemplo de la relaciones de género en el noviazgo en los estudiantes de química, lo que sigue es numerar a los 386 estudiantes un número del 0 al 386.

3. Determinar el tamaño de la población, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

• El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total.

• El porcentaje de error que se pretende aceptar al momento de hacer la generalización.• El nivel de variabilidad que se calcula para comprobar la hipótesis.

Veamos en qué consiste cada concepto:

• Definir el tamaño de la población: Significa determinar el número de individuos que la constituyen; la variable N representa el tamaño de la población. Esto es, N=X.

• Porcentaje de confianza: Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población.

Para evitar un costo muy alto se busca un porcentaje de confianza menor, comúnmente es un 95%.

El nivel de confianza no es ni un porcentaje, ni la proporción que le correspondería, a pesar de que se expresa en términos de porcentajes. Este dato se obtiene a partir de la distribución normal estándar (esto se considerará en la unidad 4).

• Porcentaje de error: Equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla falsa.

Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.

Comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

• Variabilidad: Es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere comprobar. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se indica con p, y el porcentaje con el que se rechazó la hipótesis es la variabilidad negativa, identificada por q.

Page 15: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

15Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Variabilidad positiva=p= a la probabilidad de que suceda el eventoVariabilidad negativa=q=a la probabilidad de que no suceda el evento

Por ejemplo, si tenemos 10 pelotas y 3 son rojas y 7 son negras la probabilidad de que saques una roja de una urna es de 3/7 y no 3/10. Y la probabilidad de que no saques una roja es de 7/10. Por eso dice que la negativa es el complemento de la positiva.

4. Determinar el tamaño óptimo de muestra para el estudio.

Una vez que la población, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamaño de la muestra.

En este paso, se utiliza cualquiera de las siguientes fórmulas. El uso de una u otra depende de si se conoce o no el tamaño de la población.

Para cuando no se conoce el tamaño de la población:

n es el tamaño de la muestraZ es el nivel de confianzap es la variabilidad positivaq es la variabilidad negativaE es la precisión o error

Ejemplo:

En un lote grande de medicinas, se desea verificar que la proporción de los ingredientes activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5.

Solución:

Para el nivel de confianza sea igual al 95%, tenemos que P(Z)=0.95 si Z=1.96.

Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones.

Sustituyendo:

Es decir, se ocupará una muestra de aproximadamente 384 unidades.

Para cuando se conoce el tamaño de la población:

n es el tamaño de la muestraZ es el nivel de confianzap es la variabilidad positivaq es la variabilidad negativaN es el tamaño de la poblaciónE es la precisión o error

Page 16: Programa Desarrollado...EB Cambios Mayo2010

16 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Ejemplo:

En un lote de 25,000 cajas de medicina, se desea verificar que la proporción de los ingredientes activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5.

Solución:

Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96. Sustituyendo:

En otras palabras, se ocupará una muestra de aproximadamente 378 cajas.

5. Seleccionar la muestra usando números aleatorios.

El último paso para obtener la muestra es saber qué individuos específicos de la población se tomarán. Para hacer esto debemos:

I. Numerar a los individuos de la población del 0 a N (donde N es el tamaño de la población).

II. Generar números aleatorios mediante programas computaciones (por ejemplo, Excel), funciones en calculadora o bien utilizando tablas de números aleatorios. También puedes generar números aleatorios de formas mecánicas, por ejemplo, sacando números de una urna o lanzando una moneda al aire.

III. Tomar los individuos correspondientes a los números elegidos.

Nosotros nos enfocaremos únicamente en el uso de la tabla de números aleatorios.

Procedimiento para utilizar las Tablas de Números aleatorios

Se selecciona el bloque, el renglón y la columna de la tabla. Partiendo de esta selección, se toman tantas columnas como dígitos tenga la población (N). Comenzando por el primer número de las columnas, se incluirán en la muestra aquellos individuos que en la lista de la población ocupen la posición de los n números de las columnas seleccionadas, siempre que sean menores que N. Si el número seleccionado en la tabla es mayor que N lo pasamos por alto y seguimos hasta tener la muestra total.

Page 17: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

17Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

EJEMPLO:

Suponga que tenemos la siguiente tabla de 100 datos, numerados del 00-99.

Seleccione una muestra aleatoria de 7 números.

En la figura anterior tenemos una tabla de números aleatorios tomados de este documento (http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/NumerosAleatorios.pdf), seleccionemos una fila al azar, suponga la fila 5, y separamos los números de 2 en 2, tendríamos entonces la siguiente serie de 7 números: 65 03 83 69 67 67 43 54 49 27 82 50 15 06 etc. Esto significa que nuestra muestra aleatoria deberá contener esos individuos, en el caso de 67 que se repite, solo lo consideramos una vez y pasamos al siguiente número. (En algunas calculadoras existe la función RAN# que nos proporciona también números aleatorios, en esta basta con poner en la calculadora el número de muestras + (Tecla SHIFT) + RAN# y cada vez que presionemos la tecla (=) nos dará un numero aleatorio, si solo queremos la parte entera, ignoramos al decimal).

Page 18: Programa Desarrollado...EB Cambios Mayo2010

18 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Tendríamos la siguiente tabla:

Por lo que nuestra muestra quedaría con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52.

Consideraciones específicas de la unidad

En esta unidad se trabajará con lecturas de apoyo y se resolverán problemas como ejercicios para reforzar el aprendizaje.

Tendrás que participar en una encuesta con la cual se generará una base de datos, este material lo utilizarás a lo largo del curso para que elabores las evidencias de aprendizaje de cada unidad.

Referencias:

• statistics. (2010). En Merriam-Webster Online Dictionary. • Recuperado el 8 de marzo de 2010 desde: http://www.merriam-webster.com/dictionary/statistics• Borrego, Silvia (2008). “Estadística descriptiva e inferencial”. Revista digital innovación y

experiencias educativas 13. Recuperado el 10 de marzo de 2010 desde: http://www.csi-csif.es/andalucia/modules/mod_ense/revista/pdf/Numero_13/SILVIA_BORREGO_2.pdf

• Castillo Manrique, Isabel (2006). Estadística descriptiva y cálculo de probabilidades. México: Pearson Educación.

• Galbiati Riesco, Jorge M. Conceptos Básicos de Estadística (Versión electrónica). Pontificia Universidad Católica de Valparaíso, Instituto de Estadística. Recuperado el 1 de marzo de 2010 desde: http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf

• Jordi Casal, Enric Mateu. (2003). Tipos de muestreo (versión electrónica). Rev. Epidem. Med. Prev. (2003), 1: 3-7. Recuperado el 1 de marzo de 2010 en http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf

Número aleatorio Individuo de la muestra

65 93

03 68

83 56

69 69

67 61

43 34

54 23

49 17

27 45

82 52

Page 19: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

19Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

• Larios Osorio, Víctor (1999). “Unidad 5. Teoría de muestreo”. Recuperado el 12 de marzo de 2010 desde: http://www.uaq.mx/matematicas/estadisticas/xu5.html

• Lind, Douglas, William Marchal y Samuel Wathen (2008). Estadísticaaplicadaalosnegociosylaeconomíadecimotercera edición. México: McGraw-Hill.

• Montgomery, Douglas C. y George C. Runger (1996). ProbabilidadyEstadísticaaplicadasalaingeniería.Cuarta edición. McGraw-Hill, México.

• Ritchey, Ferris (2008). Estadística para las ciencias sociales. Segunda edición. México: McGraw-Hill.

• Ruiz Muñoz, David (2004). Manual de estadística (versión electrónica). Recuperado el 9 de marzo de 2010 desde: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm

• Wackerly, Dennis D., William Mendenhall III y Richard L. Scheaffer (2010). EstadísticaMatemáticaconAplicaciones. Séptima edición. México: Cengage Learning.

• Walpole Ronald E., Raymond H. Myers et al. (2007). ProbabilidadyEstadísticaparaIngenieríayciencias.Octava Edición. México: Pearson Educación.

Page 20: Programa Desarrollado...EB Cambios Mayo2010

20 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

UNIDAD 2. ESTADÍSTICA DESCRIPTIVA

Propósitos

En esta unidad:

• Identificarás algunos conceptos que se utilizan en estadística descriptiva.• Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas.• Aplicarás las fórmulas para obtener medidas de descripción de datos.

Competencia específica

Aplica los parámetros de la estadística descriptiva para la representación gráfica y numérica de un conjunto de datos a través de muestras aleatorias simples.

Introducción

En la unidad anterior vimos que existen dos grandes divisiones de la estadística: la que se dedica a la recolección, presentación y categorización de datos, llamada estadística descriptiva, y la que se dedica a realizar hipótesis en base a dichos datos, llamada inferencial. También aprendimos a determinar el espacio de estudio, es decir la población, y las variables que se van a estudiar de acuerdo al problema planteado.

En esta unidad estudiaremos la Estadística Descriptiva, y dentro de ella aprenderemos cómo organizar y presentar los datos que se obtienen de las muestras tomadas de nuestras poblaciones, así como algunas medidas obtenidas de estos datos, como la forma en que se ubican dentro de una gráfica o tabla, y lo que esto expresa.

2.1 Organización de datos y distribución de frecuencia

Introducción

La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área sólo describe, resume, organiza y representa los datos obtenidos de una población o muestra de dicha población, sin elaborar inferencias ni obtener conclusiones.

La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación y distribución de estos datos.

A continuación veremos que existen diferentes tipos de presentación de datos y con base en ellos distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

2.1.1 Frecuencias

Dentro de los conceptos básicos para la organización de datos están los que conciernen a la frecuencia:

Frecuencia: es el número de veces que se repite un dato, también se le conoce como frecuencia absoluta.

Page 21: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

21Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables hasta el renglón i. También es conocida como frecuencia absoluta acumulada.

Frecuencia relativa: es el resultado de dividir la frecuencia entre el número total de datos (N). Este dato también puede verse como un porcentaje.

Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta el renglón i.

Podemos encontrar las frecuencias organizadas en tablas que estudiaremos más adelante. Por ahora veamos cómo se representan los tipos de frecuencia que vimos anteriormente, supongamos que tenemos la siguiente distribución de datos:

18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

2.1.2 Intervalos

Intervalo o rango: Conjunto de números comprendidos entre otros dos números dados, conocidos estos últimos como límites del intervalo.

Intervalo de clase: En estadística, se llama intervalo de clase a la expresión que nombra un intervalo.

Amplitud del intervalo: Es la diferencia del límite superior menos el límite inferior (Ls -Li).

Fronteras de clase: Son los puntos medios entre los límites de intervalos consecutivos.

No. De renglón

(i)

Datos obtenidos

de la variable

Frecuencia

fi

Frecuencia Acumulada

Fi

Frecuencia Relativa

hi

Frecuencia

Relativa acumulada

Hi

1 7 f1= 2 f1=F1= 2 h1=f1/N=0.0625 h1=H1=0.0625

2 18 f2= 6 f1+f2= F2= 8 h2=f2/N=0.1875 h1+h2=H2=0.2500

3 23 f3= 8 f1+f2+f3= F3=16 h3=f3/N=0.2500 h1+h2+h3=H3=0.5000

4 41 f4= 4f1+f2+f3+f4=

F4=20h4=f4/N=0.1250 h1+h2+h3+h4=H4=0.6250

5 47 f5= 7f1+f2+f3+f4+f5=

F5=27h5=f5/N=0.2187 h1+h2+h3+h4+h5=H5=0.8430

6 52 f6= 5f1+f2+f3+f4+f5+f6=

F6=32h6=f6/N=0.1563 h1+h2+h3+h4+h5+h6=H6=1.0000

TOTAL N=32 1.0000

Page 22: Programa Desarrollado...EB Cambios Mayo2010

22 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el límite inferior del siguiente.

Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de los límites inferior y superior del intervalo dividido entre 2. A la marca de clase también se le denomina punto medio de clase.

Ejemplo de intervalos

Veamos cómo se representan los conceptos relacionados con los intervalos.

Dados los números 15 y 25, tendríamos que:

El intervalo corresponde a todos los números que se encuentran entre el 15 y el 25.

El intervalo de clase sería: 15-25

Los límites del intervalo son:

Límite inferior = 15

Límite superior = 25

La amplitud del intervalo 15-25 sería: 25 menos 15, es decir 10. Es recomendable que todos los intervalos tengan la misma amplitud. Para ello podemos restar el dato menor del dato mayor y dividir este resultado entre el número de intervalos que se deseen.

La frontera de clase: si tomamos los intervalos 4-14, 15-25 y 26-36, las fronteras de clase serían: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por último, 25.5 y 36.5 para el tercer intervalo.

La frontera de clase no debe coincidir con los datos límites del intervalo, porque sería complicado identificar el intervalo al que pertenece dicho dato.

Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos 3.5-14.5, 14.5-25.5 y 25.5-36.5. Si se tiene el dato 25.5 no se sabría si ponerlo en el segundo o en el tercer intervalo.

Si esta coincidencia sucede deberá moverse el intervalo. Siguiendo con el ejemplo, moviéndolo un punto a la izquierda tendríamos los intervalos 2.5-13.5, 13.5-24.5 y 24.5-35.5.

La marca de clase del intervalo 15-25 es igual a: 15+25= 40/2= 20.

Es recomendable que la marca del intervalo coincida con alguno de los datos. Esto no es necesario y no siempre se logra, sobre todo cuando los intervalos tienen la misma amplitud.

2.1.3 Construcción de intervalos de clase

La formación de clases o intervalos de clase, que se representa con (k), dependen, generalmente, del tamaño del rango de la población o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente:

Page 23: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

23Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

1. Calcular el rango:

Para esto, se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es el resultado de la resta, esto es:

R= Xn – X1

Por ejemplo:

Si en una serie de datos que van desde el 18 hasta el 56, tendríamos lo siguiente:

Xn= 56 y X1= 18, por lo tanto: R= Xn – X1= 56 – 18= 38

2. Determinar el número de intervalos que se desea tener:

No existe una regla para determinar el número de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisión la toma el investigador.

Siguiendo con nuestro ejemplo, diríamos que vamos a construir 7 intervalos.

Entonces decimos que K=7.

3. Dividir el rango entre el número de intervalos que se desea tener.

Recordemos que lo recomendable es elegir un número entre 5 y 20 para los intervalos.

Dividimos entre uno menos de los intervalos deseados porque con el número de datos se acumula un intervalo más.

Siguiendo con el ejemplo, deseo 7, entonces:

38 / 7 = 5.428

Esta será la amplitud de los intervalos. Cuando no es un número entero, se escoge el entero más cercano, como en este caso, tomamos el rango igual a 5.

Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo más, entonces se divide entre el número de intervalos que se quieren.

4. Se forman los intervalos:

Los intervalos se forman comenzando un número antes del primer dato:

INTERVALOS:

17 a 22 (se cuenta 5 desde 18 hasta 22)23 a 2829 a 3435 a 4041 a 4647 a 5253 a 58 Nota: No importa que el último intervalo exceda el último dato.

Page 24: Programa Desarrollado...EB Cambios Mayo2010

24 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Ejemplo de construcción de intervalos

Veamos el siguiente ejemplo para la construcción de intervalos de clase.

El director de una consultoría en desarrollo de software desea conocer el número de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello pide a uno de sus empleados que le elabore un reporte, el empleado tiene los siguientes datos:

35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20.

Vayamos paso por paso:

1. Calcular el rango:

R= Xn – X1= 60-20=40

2. Determinar el número de intervalos entre 5 y 20:

Elegimos 8 intervalos

3. Dividir el rango entre el número de intervalos:

40/8= 5

4. Se forman los intervalos:

Comenzamos por un número anterior al límite inferior: 19-24, 25-29, 30-35, 36-40, 41-45, 46-50, 51-55, 56-60.

2.1.4 Tablas de datos

Existen diferentes tipos de tablas para presentar los datos, las más utilizadas son: Tabladedatos,Tablade frecuencias, Tablapor intervalosde clase yTablasdedobleentrada. Veamos en qué consiste cada una:

Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando la información que necesitamos son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos.

Ejemplo: Supongamos que la medición de temperatura a lo largo del día da como resultado los siguientes valores en grados Celsius: 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7. Entonces construimos una tabla como la siguiente:

2.1.5 Tablas de frecuencia

Esta nos aporta mayor información pues está formada por categorías de la variable que se esté midiendo y su frecuencia (es decir, el número de ocurrencias de un valor dado).

Temperatura (Celsius) 20.4 21.2 22.1 23.9 25.3 26.9 27.7

Page 25: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

25Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Ejemplo: suponga que un experimento da los siguientes valores medidos:

1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2

Procedemos entonces a agrupar por categorías, según la frecuencia o número de veces que aparece cada medición:

2.1.6 Tablas por intervalos de clase

En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable.

Ejemplo: En una encuesta sobre el desempleo en el Área Metropolitana de la Ciudad de México, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7 Tablas de doble entrada

Estas tablas proporcionan información referente a dos variables o eventos relacionados entre sí. Se forma poniendo en los renglones de la tabla la información de una de las variables y en las columnas la información de la otra variable.

Ejemplo: suponga que se miden el número de cirugías realizadas por edades en una muestra de 100 personas, encontrándose lo siguiente:

Valor de la Variable medida Frecuencia

1 4

2 7

3 5

4 4

5 5

6 1

Grupo de edad Frecuencia

De 12 a 19 9600

De 20 a 21 7100

De 25 a 34 3900

De 35 a 44 1500

De 45 a 99 1600

Page 26: Programa Desarrollado...EB Cambios Mayo2010

26 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango.

Por ejemplo: supongamos que medimos la temperatura de un líquido con respecto al tiempo de calentamiento. En el renglón colocamos los tiempos y en las columnas la temperatura obtenida. Podríamos considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.1.8 Recolección de la información

Hemos visto cómo se organizan los datos, pero ¿de dónde y cómo se obtienen?

Cuándo se realiza un trabajo que requiere de la estadística, las personas que realizan el trabajo diseñan sus instrumentos para recolectar la información y obtener los datos que necesitan. Existen muchos métodos para recolectar información, pero los más frecuentes son:

Censo

Es una técnica de recolección de datos que se aplica a la totalidad de los elementos que componen la población o universo que se estudia. Un censo debe cumplir dos condiciones:

Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la población. Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.

Encuesta

Esta técnica se utiliza para recolectar información de una muestra de la población. Consiste en presentar un conjunto de preguntas abiertas (preguntas que no tienen respuestas predeterminadas) o cerradas (preguntas que cuentan con una serie de respuestas establecidas).

Edades / No. de cirugías Menos de 2 cirugías Más de 2 cirugías0-10 1 0

11-20 2 221-30 6 431-40 11 741-50 17 6

Más de 50 30 14

Tiempo en minutos Temperatura en grados C

1-5 36

6-10 4411-15 67

De 35 a 44 1500De 45 a 99 1600

Page 27: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

27Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Experimento

Otra de las técnicas más recurridas en estadística para recolectar información son los experimentos, veamos en qué consisten.

Un experimento es una prueba que se realiza para determinar las características o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qué alimentos nos parecen más salados.

Un experimento, también se define como el proceso que se realiza para verificar una serie de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las características o comportamientos del fenómeno que se analiza. Por ejemplo, un experimento para determinar la velocidad de la luz en el vacío; donde se está determinando la velocidad de la luz.

La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras que en la primera no necesariamente.

En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cuál pienso que me sabrá más salado.

En el segundo ejemplo, mi hipótesis, a partir de estudios anteriores, es que la velocidad de la luz en el vacío es de 300 000 km/seg.

Mi experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error experimental.

Tema 2.2 Representación grafica de los datos

Introducción

En el tema anterior presentamos diferentes formas de organizar o de tabular datos y vimos la distribución de frecuencias. Ahora veremos la representación gráfica de los datos.

Las gráficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de gráficas, cada una de ellas se elabora con base en el tipo de información que se quiere representar.

2.2.1 Histograma

Histograma es la representación gráfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares.

• El eje horizontal se utiliza para representar a la variable independiente, es decir, a la escala de medición o fronteras de clase.

• El eje vertical representa a la escala de frecuencias. • Si los intervalos de clase tienen el mismo ancho, las alturas de las barras serán proporcionales

a las frecuencias.

El histograma también proporciona visualmente el aspecto de la distribución y dispersión de las mediciones.

Page 28: Programa Desarrollado...EB Cambios Mayo2010

28 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

2.2.2 Grafica de barras

Este tipo de grafica se utiliza para datos de tipo ordinal, nominal y discreto. En estas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura de la barra y no por el área de la barra. Esta gráfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras.

La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Barras verticales:

• En el eje horizontal se representan los valores de la variable. • En el eje vertical se representa la frecuencia de cada clase.

Barras horizontales:

• En el eje horizontal se representan las frecuencias.• En el eje vertical los valores de la variable.

Un histograma y una gráfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separación entre las barras.

2.2.3 Graficas de línea

Una grafica de líneas se construye también en un sistema coordenado rectangular, y muestra la relación entre las variables mediante puntos conectados por líneas continuas. La frecuencia de cada valor medido es representada por la altura del punto.

En el eje horizontal se representa a la variable y en el eje vertical la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obteniéndose la gráfica de línea.

2.2.4 Graficas de área (pastel)

Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta gráfica muestra la relación entre las variables dividiendo un círculo (o pastel) en sectores (o rebanadas). También se utilizan para representar la distribución de frecuencias, pero es el área de cada sector la proporcional a los valores medidos.

Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del problema con respecto a la circunferencia determinando sectores circulares para cada categoría.

EJEMPLO:

Considere la siguiente tabla de datos

Page 29: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

29Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

En esta figura se muestra el histograma de las mediciones en Cm vs. La frecuencia, note como el ancho de las clases es el mismo.

En la grafica de pastel se muestra dentro de cada “rebanada” la medición en cm y el porcentaje que corresponde a la frecuencia relativa.

Medición en Cm Frecuencia Frecuencia acumulada Porcentaje

30 3 3 3%30.1 7 10 6%30.2 12 22 10%30.3 18 40 15%30.4 23 63 19%30.5 21 84 18%30.6 17 101 14%30.7 11 112 9%30.8 5 117 4%30.9 1 118 1%

Page 30: Programa Desarrollado...EB Cambios Mayo2010

30 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

En esta figura se muestra la frecuencia acumulada mediante una grafica de línea.

Tema 2.3 Medidas de tendencia central

Introducción

Para cualquier conjunto de datos estudiados es importante tener información resumida de sus características. Esta información nos indica cómo se comporta la población de datos que tenemos. Para resumir la información se utilizan dos tipos de valores que en lugar de representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores estadísticos son: las medidas de tendencia central, que nos muestran hacia qué valores se agrupan o acumulan los datos, y las medidas de dispersión, que, de forma contraria a las anteriores, muestran cómo se dispersan o separan los datos.

Las medidas de tendencia central son los valores que representan un conjunto de datos de forma tal que nos ayudan a saber dónde están acumulados los datos pero sin indicar como se distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos.

Las medidas de tendencia central más comunes son: la media aritmética, comúnmente conocida como media o promedio, la mediana y la moda.

2.3.1 Media aritmética

La media aritmética o, simplemente, media, se denota por o por la letra μ según se calcule en una muestra o en la población, respectivamente. La media es resultado de dividir la suma de todos los valores de los datos entre el número total de datos.

La fórmula para calcular la media de una distribución de datos, varía de acuerdo a la manera cómo los tenemos organizados.

x

Page 31: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

31Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Fórmula para calcular la media en datos no agrupados.

Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir, cada valor se representa de manera individual. Las fórmulas para calcular la media son:

En estas fórmulas la diferencia radica en que, el total de la población se representa con la letra N y el total de la muestra se representa con la letra n.

Fórmula para calcular la media en datos agrupados por frecuencias simples.

Los datos agrupados en frecuencias son aquellos que organizamos en una tabla de frecuencias, es decir, las tablas que contienen, en una columna, el valor de la variable y, en otra columna, la frecuencia o el número de veces que se repite cada valor en una serie de datos. Las fórmulas para calcular la media con los datos organizados de esta manera son:

Fórmula para calcular la media en datos agrupados por intervalos

Los datos agrupados en intervalos son aquellos que se organizan dentro de un rango establecido entre un límite inferior y un límite suprior. Recuerda que las tablas de intervalos muestran el número de datos que abarca cada intervalo (frecuencia por intervalo).

Las fórmulas para calcular la media con los datos organizados de esta manera son:

2.3.2 Mediana

La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o decreciente, entonces, el número de datos que queda a la izquierda de la mediana es igual al número de datos que queda a la derecha.

Si n es impar hay un dato que queda en medio de todos, éste será igual a la mediana. Si n es par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de esos dos datos, es decir, su suma dividida entre dos.

EN UNA POBLACIÓN EN UNA MUESTRA

EN UNA POBLACIÓN EN UNA MUESTRA

EN UNA POBLACIÓN EN UNA MUESTRA

Page 32: Programa Desarrollado...EB Cambios Mayo2010

32 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Para cuando la cantidad de valores de la distribución es impar:

1. Ordenamos los valores de menor a mayor.

2. Buscamos el valor del centro.

Por ejemplo:

Supongamos que tenemos los siguientes valores:

2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9

1. Ordenamos:

0, 0, 1, ,1, 2, 4, 4, 6, 6, 7, 8, 8, 9

2. El dato que divide a la mitad es:

4, por lo tanto Me: 4

Para cuando la cantidad de valores es impar:

1. Ordenamos los valores de menor a mayor.

2. Buscamos los valores del centro.

3. Promediamos los valores del centro.

Por ejemplo:

Supongamos que tenemos los siguientes valores:

5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1 ,3, 2

1. Ordenamos

1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9

2. Buscamos los datos del centro:

4, 5

3. Promediamos:

4+5=9/2= 4.5, por lo tanto Me: 4.5

Mediana en datos agrupados por intervalos

Cuando queremos calcular la mediana en datos agrupados por intervalos, tenemos que buscar el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas, es decir, es necesario localizar el intervalo donde se encuentre N/2 , ocupamos siguiente fórmula:

Page 33: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

33Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

2.3.3 Moda

La moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta es mayor, y se denota como Mo. Algunas veces el valor que más se repite puede no ser único, es decir, puede haber dos o más datos que aparezcan con la misma frecuencia absoluta, siendo ésta la mayor. En esas ocasiones podemos hablar de poblaciones o muestras bimodales si existen dos modas o multimodales si existen más de dos.

Cuando nuestra distribución de datos es por intervalos de clase, primero localizamos el intervalo que tiene mayor frecuencia absoluta y utilizamos la siguiente fórmula para calcular la moda:

2.4 Medidas de dispersión

A diferencia de las medidas de tendencia central, que miden acumulaciones, las medidas de dispersión miden el grado de separación o alejamiento que tiene una variable estadística en torno a una medida de posición o tendencia central. Dicho grado de separación nos indica lo representativa que es la medida de posición con respecto al conjunto total de datos. A mayor dispersión menor representatividad de la medida de posición y viceversa.

Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.

2.4.1 Recorrido ( Re )

Recorrido

El recorrido representa la diferencia que hay entre el primero y el último valor de la variable, también se le conoce como rango y se denota por Re.

La fórmula para calcularlo es:

Donde:

máx xi es el valor máximo del a variable

min xi es el valor mínimo de la variable

Por ejemplo:

Supongamos que tenemos la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74, 74, 69, 52, 76.

Calculamos el rango, sustituyendo los valores:

Re=78-52=26

Page 34: Programa Desarrollado...EB Cambios Mayo2010

34 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

2.4.2 Varianza

La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de los cuadrados de las diferencias del valor de los datos menos la media aritmética de estos.

La fórmula de la varianza para datos no agrupados es:

Varianza para datos agrupados por intervalos

La fórmula para calcular la varianza en datos agrupados por intervalos es la siguiente:

2.4.3 Desviación típica o estándar

Desviación típica o estándar

La desviación típica muestra qué tan alejado está un dato del valor de la media aritmética, es decir, la diferencia que hay entre un dato y la media aritmética. Se denota como S o σ, según se calcule en una muestra o en toda la población, respectivamente.

Se define como la raíz cuadrada positiva de la varianza. Se expresa mediante las siguientes fórmulas:

En datos no agrupados:

En datos agrupados por intervalos:

EN UNA POBLACIÓN EN UNA MUESTRA

EN UNA POBLACIÓN EN UNA MUESTRA

EN UNA POBLACIÓN EN UNA MUESTRA

EN UNA POBLACIÓN EN UNA MUESTRA

Page 35: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

35Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Consideraciones específicas de la unidad

Esta unidad se trabajará con lecturas y ejercicios para ejercitar el uso de las fórmulas.

La evidencia con la que se evalúa la unidad será la representación gráfica numérica de los datos obtenidos de la muestra que seleccionaste en la evidencia de la unidad 2.

Referencias:

1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadística aplicadas a la ingeniería. McGraw-Hill, México, cuarta edición.

2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadística para Ingeniería y ciencias. México: Pearson Educación, octava edición.

3. Intervalos de clase, consultado el 26 de abril de 2010 en:

• http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descriptiva_2/estadistica_descriptiva_2.htm

4. Censo y entrevista, consultados el 26 de abril de 2010 en:

• http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc.• http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf

5. Medidas de tendencia central y dispersión, consultado el 27 de abril de 2010, en:

• http://bib l iotecavirtual . lasa l leurubamba.edu.pe/Estadist ica/res/pdf/estadisticadescriptivavariables2.pdf

• http://www.vitutor.com/estadistica.html

Page 36: Programa Desarrollado...EB Cambios Mayo2010

36 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

UNIDAD 3. INTRODUCCIÓN A LA TEORÍA DE LA PROBABILIDAD

Propósitos de la unidad

En esta unidad:

• Identificarás los conceptos básicos de la teoría de probabilidad.• Utilizarás las reglas y postulados de la probabilidad para resolver problemas en eventos aleatorios.

Competencia específica

Identifica los conceptos básicos de probabilidad para la solución de problemas mediante experimentos aleatorios.

Introducción

En las unidades anteriores vimos los principios de la Estadística y los aspectos más importantes de la Estadística Descriptiva. En esta unidad se estudiarán los conceptos y reglas básicas de la probabilidad. Ésta es una de las mejores herramientas que existen para el manejo del riesgo en las sociedades modernas, pues día a día se presentan múltiples situaciones en las que la toma de decisiones se debe realizar sin contar con que todas las variables estén bajo un perfecto control. De hecho esta situación de control total rara vez (o nunca) se da.

En estadística la probabilidad nos ayudará a hacer inferencias con los resultados obtenidos a través del manejo de los datos.

3.1 Conceptos básicos

Introducción

“Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para las que no existe conocimiento absoluto”

[August De Morgan, 1838]

La probabilidad es una constante en la vida cotidiana, a diario las personas nos preguntamos sobre la probabilidad de lluvia, la probabilidad que tenemos de obtener un trabajo, acreditar una asignatura, de salir de vacaciones, etc.

La probabilidad, como rama de las matemáticas, se utiliza extensamente en estadística, como mencionamos anteriormente, los resultaos de su aplicación son muy útiles en la toma de decisiones. Pero antes de llegar a ese punto es necesario que conozcamos los conceptos básicos del tema, como son la probabilidad misma, incertidumbre, espacio muestral, eventos, tipos de eventos, etc.

Page 37: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

37Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

3.1.1 Incertidumbre

¿Cuántas veces no hemos estado con la incertidumbre acerca del resultado nuestras calificaciones, de nuestros estudios médicos o sobre cualquier otro evento?

La incertidumbre es una duda o inseguridad que tenemos con respecto a que suceda algo. La incertidumbre aparece cuando algo es incierto.

Los posibles fenómenos de la naturaleza se pueden dividir en deterministas y aleatorios.

Los fenómenos deterministas están predeterminados antes de su realización, es decir, no importa cuántas veces lo hagamos, mientras exista igualdad de condiciones, el resultado siempre será el mismo (POR EJEMPLO, TIRAR UN OBJETO, SIEMPRE CAE).

Para un experimento aleatorio en cambio, no sabemos cuál será el resultado concreto en una realización del mismo, aunque sabemos todos los posibles resultados, incluso algún tipo de patrón es observado. Por ejemplo, el lanzamiento de una moneda es un experimento aleatorio, pues sabemos que sus posibles resultados son cara o cruz, pero no podemos saber a ciencia cierta cuál será el resultado del enésimo lanzamiento.

3.1.2 Probabilidad e incertidumbre

En probabilidad una situación de incertidumbre es aquella en la cual no se tiene absoluto control de las variables para determinar que suceda un evento. Así, en los fenómenos aleatorios o al azar aparece la incertidumbre. En estos casos, lo que observamos y podemos medir son las posibilidades de que se dé uno u otro resultado.

Por ejemplo, cuando lanzamos un dado sólo podemos saber que hay seis resultados posibles y podemos medir la frecuencia con la que aparece cada uno de esos resultados en 100 lanzamientos.

La medida de dicha frecuencia con la cual aparece cada resultado en un fenómeno aleatorio es la probabilidad con la cual se espera que aparezca dicho resultado cuando realicemos el experimento nuevamente. Por ello, cuando no tenemos control sobre las variables, es decir, cuando hay incertidumbre acerca del resultado, aparece la probabilidad, y la medida de la incertidumbre es la probabilidad.

3.1.3 Probabilidad

La probabilidad de un evento se denota como P(E), y los eventos con letras mayúsculas, por ejemplo, la probabilidad del evento A sería P(A), la probabilidad del evento B sería P(B), y así sucesivamente.

La probabilidad es una medida del grado de creencia de que un evento suceda. Ésta se puede expresar como la relación que hay entre el número de veces que un resultado aparece en n repeticiones. Esto es: La probabilidad de que un evento E suceda en un experimento es igual al número de veces, n, que aparece dicho evento, dividido entre el número total de eventos posibles, N:

P (E) = n/N

Page 38: Programa Desarrollado...EB Cambios Mayo2010

38 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Por ejemplo, la probabilidad de que al tirar un dado caiga 2 es 1/6 pues sólo hay un 2 entre seis números posibles. También podemos decir que la probabilidad de que caiga 2 al lanzar un dado es de 16.66 %.

La probabilidad se asigna en porcentajes del 0-100% o bien como fracción de la unidad, es decir un número entre 0-1, siendo el 1 o 100% un resultado seguro.

Por ejemplo:

Con frecuencia cuantificamos la probabilidad de que se presente un resultado de un experimento aleatorio asignándole una posibilidad La frase “Hay 20% de probabilidad de lluvia” que se utiliza en los pronósticos meteorológicos, refleja el porcentaje de la posibilidad de que llueva.

La probabilidad siempre está condicionada por la información que se tenga del fenómeno. Esto quiere decir que no hay probabilidades absolutas.

Por ejemplo, si nos dicen que en una urna hay 10 pelotas y se nos pregunta cuál es la probabilidad de sacar una roja sería más difícil de responder que si se nos informa cuántas pelotas rojas hay.

Para medir la probabilidad debemos tomar en cuenta cuáles son los resultados posibles del evento.

3.1.4 Espacio muestral

El conjunto de posibles resultados de un experimento aleatorio recibe el nombre de espacio muestral del experimento, se representa con la letra S. Si el espacio muestral tiene un número fijo de eventos se dice que es un espacio muestral finito, los encerraremos entre llaves.

Por ejemplo:

El espacio muestral de los posibles resultado del lanzamiento de un dado será cualquier número entre el 1 y el 6, por lo que su espacio muestral es:

S={1,2,3,4,5,6}

Existen dos formas de representar espacios muestrales y combinaciones de eventos en espacios muestrales:

Conjuntos: En el caso probabilístico, un conjunto será una agrupación de los posibles resultados de un experimento.

Por ejemplo, el espacio muestral de los posibles resultados de lanzar un dado será el conjunto:

S={1,2,3,4,5,6}

Page 39: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

39Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Diagramas de árbol: Un diagrama de árbol es un arreglo en el cual se representan los posibles resultados de un fenómeno a través de líneas llamadas ramas. En la primera rama aparecen los primeros resultados y posteriormente, por cada uno de esos resultados aparecerá otro posible resultado en la segunda rama y así sucesivamente.

Por ejemplo, el espacio muestral de los posibles resultados de lanzar un dado sería el árbol:

3.1.4.1 Conjuntos

Como vimos anteriormente, una forma de representar los espacios muestrales es a través de conjuntos, dado que en probabilidad se utilizan frecuentemente, vamos a recordar las operaciones de conjuntos:

Un conjunto es una agrupación de elementos. Los diagramas de Venn nos ayudan a visualizar conjuntos gráficamente. En un diagrama de Venn se representa un conjunto A por medio de un círculo o un óvalo que contienen los elementos de dicho conjunto.

En la imagen que se presenta, podemos observar lo siguiente:

• Los elementos de A son: 3, 5 11 y 37• Los elementos de B son: 5, 11, 15 y 16• Los que los elementos de C son: 3, 5, 15 y 35• Los elementos de todo el universo, llamado conjunto Universal U son: 2, 3, 5, 7, 11, 13, 15,

16, 35 y 37• Los conjuntos A, B y C son subconjuntos del conjunto universal U.

A

B

C

5

11

161535

3

37

27

13

Page 40: Programa Desarrollado...EB Cambios Mayo2010

40 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Operaciones básicas de conjuntos

La unión de dos conjuntos A y B es el conjunto que está formado por los elementos que aparecen en A junto con elementos de B, y se denota como:

A B

La intersección de dos conjuntos A y B es el conjunto que está formado por los elementos que pertenecen a ambos conjuntos simultáneamente. Se denota como:

A B

Si dos conjuntos A y B no tienen elementos en común su intersección es nula o vacía. En este se dice que A y B son conjuntos independientes:

A B= Ø

El complemento de un conjunto A es el conjunto que consta de todos los elementos en el universo que no están contenidos en A. Se denota por:

A’

3.5 Conjuntos y probabilidad

Los diagramas de Venn nos ayudan a visualizar un experimento. En el diagrama de Venn el espacio muestral S sería igual al conjunto universal U y que contiene los eventos simples marcados por E1, E2,……, E6. Los eventos serían representados por los subconjuntos del espacio muestral. Cuando un evento A es una colección de eventos simples, los puntos muestrales de ese evento se localizan en el interior del evento A (E2, E3, E6).

Page 41: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

41Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Aquí, podemos hablar de la probabilidad de la unión de dos eventos P(A B) o de la probabilidad de la intersección de dos eventos P(A B).

3.1.6 Evento

Un evento es un subconjunto del espacio muestral de un experimento aleatorio.

Por ejemplo:

Al lanzar un dado tenemos seis eventos posibles, que caiga cualquier número entre 1 y 6. Estos son: E�= {1}, E�= {2}, E�= {3}, E�= {4}, E�= {5} Y E�= {6}.

Cada uno de ellos es un subconjunto del conjunto total:

S={1,2,3,4,5,6}

• EVENTOS SIMPLES (E):• Cada uno de los posibles resultados de un experimento y que no se puede descomponer.

En el caso del lanzamiento del dado, cada uno de los posibles números en la cara del dado es un evento simple.

• A = { evento que salga un número impar }, A = { 1, 3, 5 }• EVENTOS COMPUESTOS:

• Los eventos A, B, C, etc., son eventos compuestos si se componen de dos o más eventos simples.

• Lanzamiento de dos monedas:• A = el evento de observar una cara, A = {HH, HT, TH, TT }

3.1.7 Tipos de espacios muestrales

Según el tipo de evento, los espacios muestrales se dividen en:

• Discretos

Los eventos que lo forman pueden ser numerados, es decir, a cada evento se le puede asignar un número entero. Así tendríamos el espacio muestral formado por los eventos: E1, E2, E3, ... En. Por ejemplo:

Los resultados de sacar una carta de una baraja inglesa pueden ser numerados del 1 al 52.

• Continuos

Los eventos que lo forman pueden alcanzar cualquier número en un rango dado. Estos eventos no pueden ser numerados porque pueden alcanzar cualquier valor de la recta. Por ejemplo:

Los resultados de medir la distancia alcanzada por un objeto en un tiempo determinado ya que el objeto puede alcanzar distancias tales como 42.773 metros o bien 1.2986742 metros. Si quisiéramos numerar las distancias y poner, por ejemplo E1 = 1.29 m de distancia y E2=1.30 metros de distancia y así para cada milímetro.

Page 42: Programa Desarrollado...EB Cambios Mayo2010

42 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

3.1.7.1 Probabilidad en espacios muestrales discretos

Si tenemos N posibles resultados igualmente probables en un espacio muestral discreto y finito, y cuyos eventos tienen la misma posibilidad de suceder, entonces la probabilidad de que suceda cada evento es 1/N.

Por ejemplo, en el lanzamiento de un dado, la probabilidad de que caiga 2 es 1/6, pues sólo hay un dos entre seis eventos posibles

3.1.8 Eventos dependientes, independientes y mutuamente excluyentes.

En ocasiones un evento o más eventos dependen de otro evento previo, es decir, un evento B ocurre dado que ocurrió un evento A antes. Si existe este tipo de relación entre eventos se dice que son eventos dependientes o condicionados (el evento B depende del evento A, o el resultado del evento B está condicionado al resultado del evento A). Por otro lado, si no existe tal relación entre eventos se dice que son eventos independientes.

Dos eventos son mutuamente excluyentes cuando no pueden suceder al mismo tiempo.

La diferencia entre los eventos mutuamente excluyentes y los independientes es que dos eventos independientes pueden suceder al mismo tiempo pero los excluyentes no.

3.2 Postulados de probabilidad

Existen tres postulados de la probabilidad, los cuales se aplican cuando el espacio muestral S es finito:

• Todo espacio muestral tiene la probabilidad 1; simbólicamente, P(S) = 1 para cualquier evento S.

Por ejemplo:

¿Cuál es la probabilidad de que al lanzar un dado caiga un número entre 1 y 6?

Aquí el conjunto de los eventos que buscamos sería igual al espacio muestral, es decir, S={1,2,3,4,5,6}

Entonces tenemos 6 eventos que posibles dentro de un espacio muestral con 6 eventos. Por lo tanto, P(S) = 6/6 = 1

EVENTO DEPENDIENTE EVENTO INDEPENDIENTEEVENTO MUTUAMENTE

EXCLUYENTE

Las evidencias de aprendizaje que

entregaste en la unidad 2 dependían del resultado

de las evidencias de aprendizaje que

entregaste en la unidad 1.

Las evidencias de aprendizaje que entregas para cada asignatura no dependen de la entrega

de las evidencias de ninguna otra asignatura.

Contestar una pregunta con cuatro

opciones de respuesta, los eventos son A o B o C o D, pero no pueden ser A y, por ejemplo B

al mismo tiempo.

Page 43: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

43Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

• La probabilidad de un evento es un número real mayor o igual a cero y menor o igual a uno, simbólicamente 0≤P (E) ≤1, para cualquier evento A.

Por ejemplo:

La probabilidad de que al lanzar una moneda caiga águila es de ½ (1 evento entre dos resultados posibles: águila o sol) y ½ = 0.5. Y sabemos que 0≤0.5≤1.

• Si dos eventos son mutuamente excluyentes, la probabilidad de que uno u otro ocurran equivale a la suma de sus probabilidades. Simbólicamente, P (A B)=P(A)+P (B))

Para dos eventos mutuamente excluyentes cualesquiera, A y B.

Por ejemplo:

En el lanzamiento de un dado, llamemos E1 a que caiga 2 y E3 a que caiga 3. La probabilidad de E2, es decir, que caiga 2 es 1/6. La probabilidad de E3, es decir, que caiga 3 es 1/6. Como en un lanzamiento no pueden caer 2 y 3 al mismo tiempo, entonces estos son eventos mutuamente excluyentes.

La unión de los eventos sería que caiga 2 o que caiga 3. Así que P(E1 E3) = P(E2) + P(E3) = 1/6 + 1/6 = 2/6 = 1/3.

3.3 Reglas básicas de probabilidad

Con frecuencia es más fácil calcular la probabilidad de algún evento si conocemos la probabilidad de otro evento. Esto puede suceder si el evento en cuestión se puede representar como la unión de otros dos eventos o como el complemento de algún evento.

Existen varias reglas que facilitan el cálculo de las probabilidades:

• La probabilidad de la unión de dos sucesos es la suma de sus probabilidades, restándose la probabilidad de su intersección. Simbólicamente se representa como:

• La probabilidad de la unión de tres sucesos es la suma de sus probabilidades, restándose la probabilidad de su intersección.

En este caso, se suma la intersección de los tres o más eventos porque al restar las intersecciones de dos en dos se resta de más la intersección de los tres.

• La probabilidad de la suma de dos eventos mutuamente excluyentes A y B, es la suma de sus probabilidades, es decir:

Page 44: Programa Desarrollado...EB Cambios Mayo2010

44 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Por ejemplo:

Suponga que se tiene un par de conjuntos como se muestra en la figura. Sea el conjunto A los numero pares, A=[2,4,6,8] y B=[1,3,5,7,9] lo impares respectivamente.

La probabilidad de la suma de tres o más eventos mutuamente excluyentes A y B, es la suma de sus probabilidades, es decir:

3.4 Probabilidad condicional

Hemos visto con anterioridad la dependencia e independencia de eventos, de ello se deriva el concepto de probabilidad condicional.

La probabilidad condicional es aquella en la que la probabilidad de que ocurra une evento depende de lo que ha ocurrido con otro evento, entonces tenemos:

Dados dos eventos A y B, la probabilidad condicional se denota como P (B|A), o como P (B dado A). Ésta se refiere a la probabilidad de que ocurra el evento B está dada a la ocurrencia anterior del evento A, y se denota como:

Así, si la ocurrencia o no del evento E1 no afecta la ocurrencia o no del evento E2, entonces decimos que los eventos E1 y E2 son independientes y P (E2/E1) = P(E2). En caso de que la probabilidad de que ocurra E2 sí se vea afectada por la ocurrencia de E1, entonces los eventos son dependientes.

3.5 Experimentos aleatorios

Vimos que la probabilidad es la medida de la incertidumbre, la cual aparece cuando no tenemos certeza de lo que va a suceder en un cierto momento. Así, la probabilidad aparece asociada a los experimentos aleatorios, pues en este tipo de experimentos no tenemos control sobre las variables y por ende no sabemos cuáles serán los resultados exactos.

Un experimento aleatorio es aquel en el cual se conocen los posibles resultados pero no se sabe con exactitud cuál de todos esos posibles resultados sucederá bajo ciertas condiciones.

Por ejemplo, al lanzar una moneda al aire, sabemos que la moneda caerá, pero no sabemos con exactitud si caerá águila o sol.

Page 45: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

45Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Consideraciones específicas de la unidad

Las actividades de la unidad consisten en la solución de problemas aplicando las reglas y los postulados de la probabilidad.

Para evaluarla tendrás que resolver una serie de problemas que se diseñaron la base de datos obtenida de la encuesta en la que participaste en la unidad 1.

g. Fuentes de consulta

• Bibliografía

1. Douglas C. Montgomery, George C. Runger. Probabilidad y Estadística aplicadas a la ingeniería. Primera Edición, McGraw-Hill, México, 1999.

2. Walpole Ronald E., Myers Raymond H. Probabilidad y Estadística. Cuarta Edición, Thomson, México, 1999.

• Ligas o portales electrónicos• http://www.vitutor.com/estadistica.html• http://www.uaq.mx/matematicas/estadisticas/xu4.html• http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm

Page 46: Programa Desarrollado...EB Cambios Mayo2010

46 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

UNIDAD 4. MODELOS DE PROBABILIDAD

Propósitos de la unidad

En esta unidad:

• Obtendrás las variables aleatorias y las distribuciones de probabilidad de experimentos aleatorios simples.

• Aplicarás los modelos de probabilidad para solucionar problemas.

Competencia específica

Utiliza los modelos de probabilidad para el análisis de eventos y situaciones en diferentes contextos a través de experimentos aleatorios.

Introducción

La utilidad de la teoría de la probabilidad en cualquier disciplina que se aplique, es que puede proporcionar un modelo matemático adecuado para la descripción de los fenómenos aleatorios con los que nos encontremos. Y muy frecuentemente, estos fenómenos tienen un comportamiento similar al de modelos ya conocidos (como binomial, de Poisson y Normal) que estudiaremos en esta unidad.

4.1 Variables aleatorias

Definición de variable aleatoria

Existen ocasiones en las que en algún experimento desconocemos no solamente el resultado del mismo, sino también el valor mismo de la variable, en estos casos es útil asociar un “número” al resultado del experimento.

Recordemos los siguientes conceptos:

• Variable: es una característica de los individuos de la población que se desea estudiar, se llaman variables porque varían de un individuo a otro y es, justamente, esa variación lo que se estudia.

• Aleatorio: tomado al azar

La Variable Aleatoria es una función que asigna un numero real a cada resultado en el espacio muestral de algún experimento aleatorio.

Las variables aleatorias se denominan con mayúscula, por ejemplo X, Y o Z. Mientras que cada uno de los posibles valores que puede tener cada variable se denomina con minúsculas, por ejemplo: x, y o z. el conjunto de valores de la variable aleatoria recibe el nombre Rango de X.

Para comprender mejor estos conceptos veamos un ejemplo conceptual:

Suponga que se analiza una muestra química determinar si existe moléculas de algún componente especifico que se esté buscando, por ejemplo algún virus. Sea X la variable aleatoria que

Page 47: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

47Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

denota el número de moléculas presentes en la muestra. Las muestras pueden tener diferentes características que las hacen variar entre ellas, tales como volumen, densidad, etc., y la variable X solo proporciona el número total de moléculas que estamos buscando. Los posibles valores de X van desde cero hasta algún número infinitamente grande.

Ejemplo: En una caja se tienen 4 bolas rojas y 3 bolas negras. Dos bolas se sacan consecutivamente de la caja. Denotemos por R a la bola roja y por N a la negra. Los posibles valores de la variable aleatoria se muestran en la siguiente tabla.

Note como el valor de la variable aleatoria puede ser cualquier número entero 0, 1 y 2.

Ejemplo: Se define a la variable aleatoria X como el costo que tiene (en pesos) el arreglar una refacción automotriz, dependiendo de si presenta defectos en la parte superior o inferior de la misma. En la siguiente tabla se presentan los datos.

Aquí los posibles valores de la variable son $0, $90 y $180 pesos respectivamente.

4.1.1 Variable aleatoria Discreta vs. Continuas

Los resultados de un experimento estadístico pueden no ser finitos o contables, tal es el caso de la medición de distancia que un auto recorre con cierta cantidad de combustible. Dado que la distancia puede ser medida con cualquier grado de exactitud, existen un número infinito de posibles distancias que pueden resultar medidas.

Una variable aleatoria discreta es aquella cuyos posibles resultados se pueden contabilizar.

Una variable aleatoria continua es aquella que puede tomar valores infinitos.

Una forma útil de diferenciar este tipo de variables es que típicamente las variables continuas representan datos medidos, tales como alturas, distancias, pesos, temperaturas, tiempo de vida, etc., mientras que las variables discretas representan conteo de datos, tales como el numero de productos defectuosos, el número de contagios de una enfermedad, etc.

Sucesos x

RR 2RN 1NR 1NN 0

Page 48: Programa Desarrollado...EB Cambios Mayo2010

48 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

4.1.2 Valor esperado

Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite muchas veces, entonces se obtienen una secuencia de valores para X. Puede emplearse un resumen de estos valores, tal como el promedio (media), para identificar el valor central de la variable aleatoria.

El valor esperado, también llamado media o esperanza, de una variable aleatoria discreta X se denota por U(X) o E(X) y es:

Ejemplo de valor esperado

Supongamos que tenemos la siguiente distribución de una variable aleatoria X.

El valor esperado sería:

E(X)= (21 x 0.25) + (22 x 0.04) + (23 x 0.06) + (24 x 0.13) + (25 x 0.1) + (26 x 0.1) + (28 x .09) + (29 x .02) + (30 x .03)

E(X) = 5.25 + 0.88 + 1.38 + 3.12 +2.5 + 2.6 + 0 +2.52 + 5.8 +0.9 =24.95

El valor esperado de una variable aleatoria no siempre coincide con alguno de los valores que puede alcanzar dicha variable. Se denomina media de la variable aleatoria debido a que es análoga a la media aritmética.

La línea roja de la siguiente gráfica, marca el valor esperado del ejemplo que vimos con anterioridad:

En resumen, la esperanza es la relación entre el valor promedio de una variable aleatoria y la probabilidad de obtener dicho valor.

x 21 22 23 24 25 26 27 28 29 30P(X=x) 0.25 0.04 0.06 0.13 0.1 0.1 0 0.09 0.2 .03

Page 49: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

49Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

4.2 Distribuciones de probabilidad

Toda variable aleatoria posee una distribución de probabilidad que describe su comportamiento.

Una distribución de probabilidad es la asignación de probabilidad a cada valor de una variable aleatoria X. Esto es, distribuir la probabilidad entre los valores o rango de la variable.

La distribución de probabilidad de una variable aleatoria es una descripción del conjunto de posibles valores que puede tomar esta variable y también de la probabilidad asociada a cada uno de estos valores del conjunto.

El evento formado por todos los resultados para los que X=x se denota como {X=x} y su probabilidad como P(X=x).

Ejemplo: Suponga que se lanza una moneda 3 veces. Los posibles valores que pueden tener son A águila o S sello. Supongamos que queremos la probabilidad de que salgan 2 Sellos. Los posibles resultados serian:

M={AAA, AAS, ASA, ASS, SAA, SAS, SSA, SSS}

Así que tenemos 8 posibilidades, cada una de estas combinaciones de 3 resultados tiene igual probabilidad, es decir, tiene una P=1/8. Como nos interesa que X asuma un valor de 2 (es decir, que salgan 2 sellos), existen 3 combinaciones que resultan en que los lanzamientos produzcan dos sellos, a saber, ASS, SAS, o SSA. Por lo que la probabilidad de que X=2 sellos es igual a la suma de las probabilidades individuales de cada combinación, y es igual a P(X=2)= 3/8.

4.3 Modelos de distribución de probabilidad

Introducción

Cuando estamos estudiando un fenómeno, y una vez obtenidos los datos, es útil hacer supuestos o conjeturas acerca de las poblaciones que estamos estudiando. Tales supuestos, que son hipótesis, generalmente son planteamientos respecto a las distribuciones de probabilidad de las poblaciones y el valor esperado de las mismas.

Los modelos de distribución de probabilidad más comunes son: el modelo binomial, el modelo de Poisson y el modelo normal.

4.3.1 Modelo binomial

En algunos experimentos sólo nos interesa que el resultado de la variable aleatoria sea uno de todos los posibles resultados.

Por ejemplo, en el caso de un examen de opción múltiple, que contenga 10 preguntas con 4 opciones cada una, sólo importará para fines de calificación aprobatoria, que se elija la respuesta correcta, mientras que no importaría cuál de todas las respuestas incorrectas se haya elegido. Así que podemos calificar al resultado como “éxito” para un sólo resultado y “fracaso” para cualquiera de los otros 3.

Page 50: Programa Desarrollado...EB Cambios Mayo2010

50 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Existen muchas aplicaciones en las que nos interesan sólo estos 2 posibles resultados cualitativos, “éxito” o “fracaso”, por lo que el experimento tiene sólo 2 resultados, a este tipo de experimento recibe el nombre de binomial.

Propiedades del modelo binomial

Las propiedades del modelo de distribución binomial son:

a) Los ensayos son independientes.

b) Cada ensayo tiene sólo 2 resultados posibles, “éxito” o “fracaso”.

c) La probabilidad de éxito en cada ensayo p permanece constante.

La variable aleatoria X seria igual al número n de ensayos donde el resultado es “éxito”, y tiene una distribución de probabilidad binomial, con parámetros p(probabilidaddeéxito) yn=1,2,…

El modelo binomial es un ejemplo de una distribución se utiliza para analizar experimentos aleatorios con variables discretas.

Fórmula del modelo binomial

La distribución binomial refleja el número de secuencia de diferentes ensayos con x éxitos y n-x fracasos. Ésta se obtiene con la fórmula:

Donde: Por ejemplo:

Ejemplo del modelo binomial

Ahora veamos un ejemplo de distribución binomial, para ello supongamos lo siguiente:

La probabilidad de que un paciente se recupere una vez que ha desarrollado cierto tipo de cáncer es de 0.32. En un pabellón con 27 enfermos de este tipo de cáncer queremos determinar lo siguiente:

A) ¿Cuál es la probabilidad de que sobrevivan exactamente 13 pacientes?

Si x es el número de personas que sobreviven:

Page 51: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

51Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

B) ¿Cuál es la probabilidad de que sobrevivan de 10 a 18 pacientes?

La probabilidad de que sobrevivan de 10 a 18 pacientes debemos calcular

P(10≤x≤13)=P(10)+P(11)+P(12)+P(13)

Es decir, podemos aplicar una sumatoria de probabilidades desde x=10 hasta x=13

Donde P(x=10)=0.134, P(x=11)=0.098, P(x=12)=0.061 y P(x=13) ya se había calculado en el inciso anterior:

Como debe ser obvio en este punto, la probabilidad de que se salven menos personas es más grande, mientras que la probabilidad de que se salven más y más personas va disminuyendo.

C) ¿Cuál es la probabilidad de que sobrevivan al menos 4 pacientes?

Para este caso tenemos:

Por lo que la sumatoria tendría 24 términos!!!

Pero podemos utilizar las propiedades de la probabilidad. Si calculamos la probabilidad del complemento, tendríamos:

y así solo calculamos 3 términos:

Page 52: Programa Desarrollado...EB Cambios Mayo2010

52 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Representación gráfica del ejemplo:

En la figura se muestra la distribución binomial para este ejemplo, calculando las Probabilidades para x=0,…27 y graficándolas.

4.3.2 Modelo de Poisson

Existen otros experimentos en los que lo que se busca es determinar el número de eventos que suceden en tiempo o espacio finito y no si el resultado es éxito o fracaso.

Por ejemplo, conocer el número de autos que pasan por una cierta ruta en un intervalo de tiempo, determinar el número de llamadas simultáneas que está procesando una antena de telefonía celular, saber el número de accesos que tiene un servidor web por segundo, etc.

Para llevar a cabo el análisis de este tipo de experimentos, se utiliza el modelo de Poisson.

Propiedades del modelo de Poisson

El modelo de Poisson tiene las siguientes propiedades:

1. El número de resultados que ocurren en un intervalo de tiempo o región es independiente de los resultados que puedan ocurrir en otro intervalo o región.

2. La probabilidad de que un resultado ocurra en un intervalo de tiempo o región es proporcional a la duración de éstos.

3. La probabilidad de más de una ocurrencia en el intervalo es cero.

La distribución de Poisson se calcula con la fórmula:

Donde:

x= 0, 1,2,…

λ= a un número positivo y representa el promedio de ocurrencias esperadas en el intervalo (frecuencia de ocurrencia).

e= al número irracional ya estudiado en cursos de álgebra, igual a 2.7182818284590452354…….

Page 53: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

53Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Gráfica del modelo Poisson

En la figura se muestran 3 distribuciones de Poisson con frecuencias de 4,6 y 10 respectivamente, para x=1…30.

Ejemplo del modelo de Poisson

El promedio de camiones de carga que llegan a un puesto aduanal es de 13 camiones por hora. El puesto aduanal puede atender máximo 21 camiones por hora.

A) ¿Cuál es la probabilidad de que en determinada hora se atiendan 10 camiones?

Se tiene que la frecuencia esperada de camiones es λ=13, entonces:

B) ¿Cuál es la probabilidad de que estén funcionando al tope de su capacidad de atención?

Para este caso tenemos un máximo de ocupación, es decir λ=21, entonces:

Es decir, es menos probable que esté lleno el puesto aduanal.

4.3.3 Modelo Normal

Esta es sin lugar a dudas, la más importante de las distribuciones continuas de probabilidad en todo el campo de la estadística. Se le conoce como distribución normal o gaussiana. A su curva característica se le llama curva normal o campana, por la forma parecida a una campana que presenta.

Page 54: Programa Desarrollado...EB Cambios Mayo2010

54 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Esta distribución aparece con mucha frecuencia en una gran cantidad de fenómenos que ocurren en la naturaleza, la industria, la investigación tecnológica y social. Además, los errores asociados a los sistemas de medida utilizados, están bien aproximados por la distribución normal, lo que nos permite manejar correctamente la incertidumbre debida a los métodos de medición.

Por ejemplo, considérese dos individuos que tratan de estimar la longitud de una barra, y para ello se les proporciona la misma cinta métrica. Ambos acabarán con la misma medida aproximada de la barra, con un margen de error pequeño. Pero si las cintas métricas fueran ligeramente distintas, la longitud y el margen de error se verían afectados, en este caso porque el instrumento de medida proporciona distinta información a cada individuo.

Propiedades del modelo normal

La distribución normal tiene las siguientes propiedades:

1. El máximo ocurre para x= μ

2. La curva es simétrica alrededor de μ

3. La curva tiene sus puntos de inflexión (puntos en que la curva cambia de cóncava a convexa) en x= μ± σ

4. La curva se aproxima al eje horizontal de forma asintótica

5. El área total de la curva normal es igual a 1 (toda posible gama de posibilidades está contemplada p=[0,1])

Fórmula para calcular distribución normal

La distribución normal depende de 2 parámetros, la media μ y la deviación estándar σ.

La fórmula para la distribución normal de una variable discreta es la siguiente:

donde:

μ es la media

σ es la desviación estándar

π=3.14159…

Representación gráfica del modelo normal

Una vez que la media y la desviación estándar se especifican, la curva normal queda completamente descrita. El valor de μ determina el centro de la distribución, mientras que σ determina la dispersión. A continuación se muestran algunas curvas con distintos valores de μ y σ.

Page 55: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

55Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

En la ambas figuras se muestran distribuciones normales con medias iguales (cero en ambos casos), pero la deviación estándar aumenta la dispersión para la segunda figura.

Campana de Gauss

La siguiente figura muestra la distribución normal con las áreas de probabilidad comprendidas entre la media y unidades medidas en términos de la deviación estándar.

Esta representación es útil porque para cualquier distribución normal se tiene que:

Debido a que el 99.7% de la probabilidad está comprendida en el intervalo de ±3σ, a menudo se

hace referencia a la cantidad 6σ como una medida del ancho de la distribución normal.

Variable aleatoria normal estándar

Una variable aleatoria normal con µ=0 y σ=1 recibe el nombre de variable aleatoria normal estándar o normal tipificada y se denota por la letra Z.

La ventaja de las variables normales estándar está en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

Page 56: Programa Desarrollado...EB Cambios Mayo2010

56 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Toda distribución normal se puede transformar en una normal tipificada, para transformarla se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por su desviación típica, se denota como:

Procedimiento para transformar una variable a variable normal estándar

Veamos un ejemplo sobre cómo convertir una distribución normal a una normal tipificada.

El salario medio de los empleados de una empresa se distribuye según una distribución normal, con media 5 millones de pesos y desviación típica 1 millón de pesos. Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de pesos.

1. Transformamos esa distribución en una normal tipificada, para ello se crea una nueva variable (Y):

2. Sustituimos la fórmula y la nueva variable sería:

3. Esta nueva variable se distribuye como una normal tipificada. La variable Y que corresponde a una variable X de valor 7 es:

Ya podemos consultar en la tabla (más adelante veremos cómo) la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de sueldos inferiores a 7 millones de pesos). Esta probabilidad es 0,97725. Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 millones de ptas. es del 97,725%.

Cómo se usa la tabla de valores para la distribución normal estándar

La tabla de probabilidad normal estándar se utiliza se la siguiente manera.

La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila nos indica el segundo decimal del valor que estamos consultando.

1. Se localiza en una Tabla de la distribución normal estándar acumulada el valor de z buscado en la primera columna, aproximando la unidad y una décima.

2. Una vez localizado, se recorre el renglón de la tabla hasta encontrar la z que corresponda a la centésima más próxima.

Page 57: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

57Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

3. En la intersección de la columna y renglón aparece la probabilidad buscada.

Ejemplo: Suponga que Z es una variable normal estándar. Encuentre la P (Z≤1.34).

Buscando en la tabla nos da un valor de P (Z≤1.34)=0.9099, es decir, tiene el 90.1% del área total de la curva de probabilidad hasta Z=1.34, como se muestra a continuación.

Continuando con el ejemplo anterior, si quisiéramos calcular la P (Z>1.34) entonces, sería más conveniente calcularlo así:

P (Z>1.34)=1 – P (Z≤1.34) = 1 – 0.9099 = 0.0901

Y su gráfica se muestra a continuación,

Page 58: Programa Desarrollado...EB Cambios Mayo2010

58 Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Si quisiéramos la probabilidad entre 2 valores, tendríamos que realizar la resta de aéreas, por ejemplo:

P (1.21 <Z≤1.34)=P (Z≤1.34) – P (Z≤1.21) = 0.9099 - 0.8869 = 0.023

Y su gráfica se muestra a continuación,

Consideraciones específicas de la unidad

Al igual que en las unidades anteriores, en ésta tendrás que resolver problemas donde se apliquen los procedimientos presentados. La evidencia es la solución de problemas aplicando los modelos de la probabilidad.

Por último, al finalizar la unidad, tendrás que resolver un problema en el que se trabaja todo el contenido que abarca la asignatura, es la quinta y última evidencia de aprendizaje del curso.

Fuentes de consulta

• Bibliografía

1. Douglas C. Montgomery, George C. Runger. Probabilidad y Estadística aplicadas a la ingeniería. Primera Edición, McGraw-Hill, México, 1999.

2. Walpole Ronald E., Myers Raymond H. Probabilidad y Estadística. Cuarta Edición, Thomson, México, 1999.

• Ligas o portales electrónicos• http://www.vitutor.com/estadistica.html• http://www.uaq.mx/matematicas/estadisticas/xu4.html• http://math2.org/math/stat/distributions/es-z-dist.htm• http://www.est.uc3m.es/esp/nueva_docencia/leganes/ing_tec_teleco_todas/

estadistica/doc_generica/archivos/Tabla%20Normal%20COL.pdf• http://www.vitutor.com/pro/5/a_3.html• Tabla de valores para la distribución normal estándar, recuperada el 6 de abril desde:• http://www.ust.cl/html/cree/asignaturas/material_profesor/material_bioestadis/

Tabla%20Z.pdf

Page 59: Programa Desarrollado...EB Cambios Mayo2010

Estadística básicaPROGRAMA DESARROLLADO

59Educación Superior Abierta y a Distancia • Primer Cuatrimestre

Estadística básicaPROGRAMA DESARROLLADO

Unidad Actividad Fecha de entrega

(Fecha de cierre de la

herramienta)

Herramienta Fecha límite de retroalimentación

Tipo de actividad

Ponderación

1 Encuesta 9 de junio Encuesta/Moodle

S/R Formativa S/P

Problemas 1, determinar el tamaño de la muestra 13 de junio Tareas 17 de junio Formativa S/P

Problemas 2, cierre de unidad 13 de junio Tareas 17 de junio Formativa S/P

Foro "Importancia de la estadística" 20 de junio Foro 20 de junio Formativa S/P

Autoevaluación, ruleta 20 de junio Aula virtual S/R Formativa S/PEvidencia, muestra aleatoria 20 de junio Portafolio de

evidencias25 de junio Sumativa 8%

22 Frecuencias 27 de junio Tareas 1 de julio Formativa S/PIntervalos 27 de junio Tareas 1 de julio Formativa S/PGráficas 4 de julio Tareas 9 de julio Formativa S/P

Medidas de tendencia central y dispersión 4 de julio Tareas 9 de julio Formativa S/PAutoevaluación, rally 11 de julio Aula virtual S/R Formativa S/P

Evidencia, representación gráfica y numérica de datos

11 de julio Portafolio de evidencias

21 de julio Sumativa 16%

3 Problemas, postulados de probabilidad 18 de julio Tareas 23 de julio Formativa S/P

Problemas, reglas de probabilidad 18 de julio Tareas 23 de julio Formativa S/P

Problemas, probabilidad condicional 25 de julio Tareas 28 de julio Formativa S/P

Autoevaluación, tiro al blanco 25 de julio Aula virtual S/R Formativa S/P

Evidencia, problemas de probabilidad 8 de agosto Portafolio de evidencias

18 de agosto Sumativa 16%

4 Problemas, modelo binomial 8 de agosto Tareas 11 de agosto Formativa S/PProblemas, modelo Poisson 15 de agosto Tareas 20 de agosto Formativa S/PProblemas, modelo normal 15 de agosto Tareas 20 de agosto Formativa S/P

Autoevaluación 22 de agosto Aula virtual S/R Formativa S/PEvidencia, modelos de probabilidad 22 de agosto Portafolio de

evidencias29 de agosto Sumativa 16%

N/A 29 de agosto Portafolio de evidencias

5 de septiembre

Sumativa 24%

N/A Por asignar N/A N/A Sumativa 20%

VIII. CALENDARIO DE ACTIVIDADES