estadística y diseño experimental 2011

Upload: ever-cardozo

Post on 05-Jul-2018

224 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/15/2019 Estadística y Diseño Experimental 2011

    1/214

    x,2

    1)(

    2

    21 x

    e x f

    Mg Hugo Fernando Ayan

  • 8/15/2019 Estadística y Diseño Experimental 2011

    2/214

    2

    Contenidos

    Programa Analítico ....................................................................................................... 7 Guía de Trabajos Prácticos ............................................................................................ 9 Programa de Examen Final ......................................................................................... 11

    Estadística y Biometría ................................................................................................... 13 Organización de Datos ................................................................................................ 15 Variables cualitativas o categóricas ............................................................................. 15 Variables cuantitativas ................................................................................................ 16 Otras formas de clasificación....................................................................................... 16 Modalidad - Clases...................................................................................................... 17 Tablas estadísticas ....................................................................................................... 17 Distribución de frecuencias ......................................................................................... 18 Elección de intervalos para variables continuas ........................................................... 20 Representaciones Gráficas........................................................................................... 22 Gráficos para variables cualitativas ............................................................................. 24 Diagramas de sectores ................................................................................................. 25 Pictogramas ................................................................................................................ 25 Gráficos para variables cuantitativas ........................................................................... 25 Diagramas diferenciales .............................................................................................. 26 Diagramas integrales ................................................................................................... 26 Gráficos para variables discretas ................................................................................. 26 Gráficos para variables continuas ................................................................................ 27 Histogramas ................................................................................................................ 27 Polígonos de frecuencias ............................................................................................. 27 Diagrama de barras de error ........................................................................................ 29

    Diagramas de dispersión ............................................................................................. 30

    Funciones matemáticas lineales y cuadradas................................................................ 31 Función lineal y ecuación de la recta ........................................................................... 31 Función lineal como propiedad de los sistemas generales ............................................ 32 Interpretación geométrica ............................................................................................ 32 Función cuadrática ...................................................................................................... 34 Estudio de la función ................................................................................................... 35 Medidas descriptivas estadísticas ................................................................................ 41 Estadísticos de tendencia central ................................................................................. 41 Mediana ...................................................................................................................... 42 Moda .......................................................................................................................... 43

    Estadísticos de posición: Cuartiles (Ql) ........................................................................ 45 Estadísticos de posición: Percentiles ............................................................................ 45 Deciles ........................................................................................................................ 46 Medidas de dispersión ................................................................................................. 47 Amplitud (A) o Rango................................................................................................. 47 Varianza ...................................................................................................................... 49 Desviación estándar .................................................................................................... 49 Grados de libertad ....................................................................................................... 49 Propiedades del desvío standard .................................................................................. 50 Coeficiente de Variación ............................................................................................. 50 Asimetría o sesgo ........................................................................................................ 51 Apuntamiento (Curtosis) ............................................................................................. 52 Cálculo de Probabilidades ........................................................................................... 55 Experimentos y Sucesos Aleatorios (condiciones) ....................................................... 55

  • 8/15/2019 Estadística y Diseño Experimental 2011

    3/214

    3

    Nociones de Probabilidad ............................................................................................ 57 Probabilidad Clásica.................................................................................................... 57 Probabilidad Frecuencial ............................................................................................. 58 Axiomas...................................................................................................................... 58 Probabilidad Condicional ............................................................................................ 59

    Independencia Estadística ........................................................................................... 60 Modelos discretos ....................................................................................................... 60 Experimentos de Bernoulli .......................................................................................... 60 Modelo Matemático .................................................................................................... 60 Modelo Probabilístico Binomial .................................................................................. 61 Variable Aleatoria ....................................................................................................... 62 Función de Probabilidad .............................................................................................. 63 Función de densidad v.a. discreta ................................................................................ 65 Esperanza Matemática................................................................................................. 65 Varianza Poblacional .................................................................................................. 66 Distribución Normal.................................................................................................... 67

    Distribución Normal estandarizada .............................................................................. 69 Tabla ........................................................................................................................... 70 Distribución de Estadísticos Muestrales ...................................................................... 72 Distribución muestral de un estadístico ....................................................................... 72 Distribución del Estadístico media muestral ................................................................ 73 Teorema Central del Límite ......................................................................................... 76 Distribución ―T de Student ........................................................................................ 76 Muestreo ..................................................................................................................... 78 Muestreo probabilístico ............................................................................................... 78 Distribución ―Chi-cuadrado ....................................................................................... 80 Distribución de Probabilidad de Variables Discretas.................................................... 81 q p(θ).................................................................................................................... 82 Los Modelos Simbólicos (Matemáticos) ...................................................................... 83 El Estimador ............................................................................................................... 85 Estimación: puntual y por intervalos ........................................................................... 85 Estimación puntual ...................................................................................................... 85 Estimación por intervalos ............................................................................................ 85 Propiedades deseables en los estimadores .................................................................... 85 Intervalos de confianza para los principales parámetros El caso de la media ................ 86 El Caso de Desconocer la Varianza Poblacional .......................................................... 89 Probabilidad normal presentada en una y dos colas ..................................................... 91

    Intervalos de confianza para OTROS parámetros ........................................................ 91

    Contrastes de Hipótesis ............................................................................................... 95 Ensayo de una cola ...................................................................................................... 97 Intervalo de Confianza y Contraste de Hipótesis.......................................................... 99 Contrastes para la media.............................................................................................. 99 Tests de una cola con varianza conocida.................................................................... 100 Test de dos colas con varianza desconocida ............................................................... 102 Contrastes para la varianza ........................................................................................ 106 Contraste bilateral ..................................................................................................... 106 Contrastes unilaterales............................................................................................... 107 Inferencia basada en dos muestras ............................................................................. 109

    Análisis de la Varianza .............................................................................................. 117 Especificación del modelo ......................................................................................... 118 Algo de notación relativa al modelo .......................................................................... 121

    http://c/Documents%20and%20Settings/Ing.%20Hugo%20Ayan/Mis%20documentos/UNLaR/E%20y%20B/Estad%C3%ADstica%20y%20Dise%C3%B1o%20Experimental%202011.doc%23_Toc286218715http://c/Documents%20and%20Settings/Ing.%20Hugo%20Ayan/Mis%20documentos/UNLaR/E%20y%20B/Estad%C3%ADstica%20y%20Dise%C3%B1o%20Experimental%202011.doc%23_Toc286218715http://c/Documents%20and%20Settings/Ing.%20Hugo%20Ayan/Mis%20documentos/UNLaR/E%20y%20B/Estad%C3%ADstica%20y%20Dise%C3%B1o%20Experimental%202011.doc%23_Toc286218715http://c/Documents%20and%20Settings/Ing.%20Hugo%20Ayan/Mis%20documentos/UNLaR/E%20y%20B/Estad%C3%ADstica%20y%20Dise%C3%B1o%20Experimental%202011.doc%23_Toc286218715http://c/Documents%20and%20Settings/Ing.%20Hugo%20Ayan/Mis%20documentos/UNLaR/E%20y%20B/Estad%C3%ADstica%20y%20Dise%C3%B1o%20Experimental%202011.doc%23_Toc286218715

  • 8/15/2019 Estadística y Diseño Experimental 2011

    4/214

    4

    Forma de efectuar el contraste ................................................................................... 121 Consideraciones a los supuestos del modelo .............................................................. 126 Normalidad ............................................................................................................... 126 Homogeneidad de varianza: prueba de Levene ......................................................... 127 Homogeneidad de varianza: gráfico de dispersión .................................................... 128

    Independencia ........................................................................................................... 128 Ventajas y limitaciones del Análisis de la Varianza ................................................... 129 Comparaciones Múltiples .......................................................................................... 130 Regresión y Correlación ............................................................................................ 131 Relaciones entre variables y regresión ....................................................................... 131 Diagramas de dispersión o nube de puntos ................................................................ 132 Predicción de una variable en función de la otra. ....................................................... 133 Cómo reconocer relación directa e inversa. ............................................................... 133 Cómo reconocer buena o mala relación ..................................................................... 134 Covarianza de dos variables X e Y ............................................................................ 135 Coeficiente de correlación lineal de Pearson .............................................................. 135

    Propiedades de r ........................................................................................................ 136 Otros coeficientes de correlación ............................................................................... 140 Regresión .................................................................................................................. 140 Modelo de regresión lineal simple ............................................................................. 141 ¿Cómo medir la bondad de una regresión? ................................................................ 143 Bondad de un ajuste .................................................................................................. 144 Otros modelos de regresión ....................................................................................... 145 Modelos de análisis de regresión ............................................................................... 146 Errores de Predicción ................................................................................................ 150 El coeficiente de regresión y la reducción del error en la estimación .......................... 152 Validación de los supuestos ....................................................................................... 155 Regresión múltiple .................................................................................................... 157 Series de Tiempo....................................................................................................... 159 Definición de serie de tiempo .................................................................................... 159 Descomposición de una serie de tiempo .................................................................... 160 Pruebas No Paramétricas ........................................................................................... 165 Aleatoriedad de una muestra: Test de rachas ............................................................. 165 Normalidad de una muestra: Test de D'Agostino ....................................................... 167 Contraste de Wilcoxon para muestras apareadas ........................................................ 167 Aproximación normal en el contraste de Wilcoxon.................................................... 168 Contraste de Kruskal-Wallis ...................................................................................... 168

    Tablas de Contingencia ............................................................................................. 170

    Diseño de Experimentos................................................................................................ 175 Concepto, Objetivo e Importancia ............................................................................. 175 Necesidad de realizar la Experimentación y la Investigación ..................................... 176 Etapas fundamentales de la Experimención Agropecuaria ......................................... 176 El Método Científico ................................................................................................. 177 Modelos .................................................................................................................... 178 Tipos de variabilidad. ................................................................................................ 180 Planificación de un experimento ................................................................................ 181 Resumen de los principales conceptos. ...................................................................... 188 Principios básicos en el diseño de experimentos. ....................................................... 188

    Fuentes de Error ........................................................................................................ 190 Estructura de parcelas................................................................................................ 190 Diseño de la estructura de parcelas ............................................................................ 191

  • 8/15/2019 Estadística y Diseño Experimental 2011

    5/214

    5

    Algunos diseños clásicos ........................................................................................... 191 Completamente aleatorizado ..................................................................................... 191 Comparaciones múltiples .......................................................................................... 192 Prueba de Tukey ....................................................................................................... 192 Prueba de Fisher ........................................................................................................ 194

    Bloques completos aleatorizados ............................................................................... 195 Cuadrado latino ......................................................................................................... 198 Estructura de tratamientos ......................................................................................... 200 Experimentos Factoriales .......................................................................................... 201

    Glosario de términos estadísticos .................................................................................. 202 Glosario de términos estadísticos .................................................................................. 202

  • 8/15/2019 Estadística y Diseño Experimental 2011

    6/214

    6

    Condición de Regularidad

    Promedio mínimo de 4 (cuatro) 80 % asistencia (teórica – práctica). Aprobar 2 parciales con un mínimo de 4 (cuatro). Se puede recuperar 1 (un) parcial. Aprobar la parte práctica con un mínimo de 4 (cuatro).

    Examen final para alumnos regulares

    Aquellos alumnos que reúnan las condiciones de regularización, podrán rendirexamen final en forma oral, sobre los contenidos durante el dictado del presenteciclo lectivo.

    Examen final para alumnos libres

    Aquellos alumnos que no alcancen las condiciones mínimas de regularidad, podránrendir la asignatura en condición de alumnos libres, con examen final escrito y oralsobre todos los contenidos del programa

    Bibliografía Básica

    DI RIENZO, J. CASANOVES, F. GONZALEZ, L. TABLADA, M. DIAZ, M.P.ROBLEDO, C. BALZARINI, M. (1999) Estadística para Ciencias Agropecuarias.Screen Ed. 2da

    CASANOVES, F. DI RIENNZO, J. ROBLEDO, C. (1998) Bases para EstadísticaExperimental. Screen Ed.

    AYAN H F. 2009. Estadística y Biometría. Sede Universitaria Chamical. Apuntede la cátedra (en fotocopiadora)

    Bibliografía sugerida

    MONTGOMERY, DOUGLAS C. (1991) Diseño y Análisis de Experimentos. Ed.Grupo Iberoamericana 589 p.

    BERENSON, M.L. LEVINE, D.M. (1992) Estadística para Administración yEconomía. Interamericana. 720 p.

    MENDENHALL, W. WACKRLY, D., SCHEAFFER, R. (1994) EstadísticaMatemática con Aplicaciones. 2da. Ed. Grupo Iberoamericana. 464 p.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    7/214

    7

    Programa Anal íticoUnidad Nº 1: Estadística Descriptiva

    Contenidos: Formulación del problema. Necesidad y finalidad de la Investigación. Poblacióny Muestra. Variables. Tipos de variables. Distribuciones de frecuencia de una variablealeatoria. Representaciones gráficas de los resultados de estudios experimentales uobservacionales. Medidas de resumen de la distribución de frecuencias de una variablealeatoria en una muestra. Funciones matemáticas lineales y cuadradas. Función lineal yecuación de la recta. Interpretación geométrica. Función Cuadrática. Interpretacióngeométrica. Medidas descriptivas. Estadísticos de Tendencia central. Estadísticos de posición.Medidas de dispersión.

    Unidad Nº 2: Distribución de Variables Aleatorias

    Contenidos: Espacio muestral. Eventos. Concepto de Probabilidad. Evento Aleatorio.Concepto de variable aleatoria. Distribución de una variable aleatoria. Función de distribuciónacumulada. Función de densidad para variables aleatorias discretas y continuas. Medidasresumen de la distribución de una variable aleatoria. Esperanza y Varianza de variablesaleatorias. Propiedades. Cuantiles de una distribución.

    Unidad Nº 3: Distribución en el muestreo

    Contenidos: La función de densidad normal. Estandarización. Función de distribuciónacumulada normal. Uso de la tabla para distribución normal. Distribución del Estadístico

    media muestral. Teorema central de límite. Distribución "t de Student". Distribución de ladiferencia de dos medias muestrales (varianzas conocidas y desconocidas). Distribución dela varianza muestral. Distribución "Chi-Cuadrado" (2).

    Unidad Nº 4: Inferencia Estadística. Estimación de Parámetros.

    Contenidos: Estimación puntual. Propiedades de los buenos estimadores. Estimación porintervalo. Procedimiento general para encontrar un intervalo de confianza para un parámetrodistribucional. Interpretación del intervalo de confianza. Estimación por intervalo de laesperanza de la distribución de una variable aleatoria normal. Cálculo del tamaño muestral

    para obtener un intervalo de confianza para con una amplitud determinada.

    Unidad Nº 5: Inferencia Estadística. Prueba de Hipótesis

    Contenidos: Concepto de prueba de Hipótesis. Hipótesis Nula y Alternativa. Procedimiento dela prueba de Hipótesis. Errores de Tipo I y Tipo II. Relación entre los intervalos de Confianzay las Pruebas de Hipótesis. Prueba de Hipótesis acerca de la esperanza de una distribucióncuando se conoce 2. Estimación por intervalos para la esperanza de una distribución normalcuando se conoce 2. Prueba de hipótesis acerca de la esperanza de una distribución normal

    cuando2

    es desconocida.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    8/214

    8

    Unidad Nº 6: Inferencia sobre la Esperanza y la Varianza de una y dosdistribuciones normales.

    Contenidos: Estimación por intervalos para la esperanza de una distribución normal cuando2

    es desconocida. Contraste de hipótesis referente a la varianza de una distribución normal.Estimación por intervalo de la varianza de una distribución. Estimación por intervalo referentea las varianzas de dos distribuciones. Distribución F. Prueba de hipótesis referente a lasesperanzas de dos distribuciones con varianzas conocidas y desconocidas. Observacionesapareadas: prueba de hipótesis y estimación por intervalo.

    Unidad Nº 7: Análisis de Regresión y Correlación LinealContenidos: Análisis de Regresión Lineal. Estimación de la Recta de Regresión. Método delos Mínimos Cuadrados. Estimaciones y Predicciones. Los supuestos del Análisis deRegresión. Análisis de los Residuales. Análisis de la variación en la variable dependiente Y.Prueba de Hipótesis. Análisis de Correlación Lineal. Los supuestos del Análisis decorrelación. Coeficiente de Correlación Lineal. Prueba de Hipótesis. Regresión Múltiple.Series de Tiempo. Definición. Descomposición de una serie de tiempo.

    Unidad Nº 8: Pruebas No Paramétricas. Análisis de Datos CategorizadosContenidos: Pruebas No Paramétricas.Test de Rachas. Test de D‘Agostino. Contraste deWilcoxon para muestras apareadas. Contraste de Kruskal-Wallis. Tablas de Contingencia.Medidas de Asociación. Pruebas de hipótesis de homogeneidad de proporciones. Pruebas dehipótesis de independencia. Pruebas de bondad de ajuste.

    Unidad Nº 9: Análisis de la varianza Contenidos: Definiciones preliminares. Diseño completamente aleatorizado. El análisis de lavarianza de efectos fijos a un criterio de clasificación. El ANAVA y los cuadrados medios. La partición de la suma de cuadrados y la tabla de ANAVA. Supuestos del ANAVA. Análisis delos residuales. Pruebas a posteriori "el test de Tukey"y el de ―Fisher.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    9/214

    9

    Guía de Trabaj os Pr ácticosPráctico °1: Estadística Descriptiva

    Contenidos: Tablas de frecuencia de una variable aleatoria. Representaciones gráficas de losresultados. Medidas de resumen de la distribución de frecuencias de una variable aleatoria enuna muestra. Funciones lineal y cuadrática

    Práctico Nº 2: Variables Aleatorias

    Contenidos: Eventos. Probabilidad. Variable aleatoria. Función de densidad para variablesaleatorias discretas y continuas. Medidas resumen de la distribución de una variable aleatoria.Esperanza y Varianza de variables aleatorias.

    Práctico Nº 3: Distribución en el muestreo

    Contenidos: La función de densidad normal. Estandarización. Función de distribuciónacumulada normal. Uso de la tabla para distribución normal. Distribución del Estadísticomedia muestral. Uso de la tabla "t de Student". Distribución de la diferencia de dos mediasmuestrales (varianzas conocidas y desconocidas). Distribución de la varianza muestral. Usode la tabla "Chi-Cuadrado" (2).

    Práctico Nº 4: Estimación de Parámetros

    Contenidos: Estimación puntual. Estimación por intervalo. Interpretación del intervalo deconfianza. Cálculo del tamaño muestral.

    Práctico Nº 5: Prueba de Hipótesis

    Contenidos: Prueba de Hipótesis. Hipótesis Nula y Alternativa. Errores de Tipo I y Tipo II.Estimación por intervalos para la esperanza de una distribución normalcon y sin σ2 conocida.

    Práctico Nº 6: Inferencia sobre la esperanza y varianza de una y dosdistribuciones normales

    Contenidos: Prueba de Hipótesis acerca de la esperanza de una distribución cuando se conoce2 y cuando la misma es desconocida. Contraste de hipótesis referente a la esperanza y

    varianza de una distribución normal. Estimación por intervalo referente a las varianzas dedos distribuciones. Uso de la tabla para la distribución ―F .

  • 8/15/2019 Estadística y Diseño Experimental 2011

    10/214

    10

    Práctico Nº 7: Regresión Lineal Contenidos: Estimación de la Recta de Regresión. Los supuestos del Análisis de Regresión.Análisis de los Residuales. Prueba de Hipótesis. Análisis de Correlación Lineal. Análisis deRegresión Lineal Múltiple. Series de Tiempo.

    Práctico Nº 8: Pruebas No Paramétricas. Análisis de DatosCategorizados Contenidos: Pruebas no paramétricas. Test de Rachas.Test de D‘Agostino. Contraste deWilcoxon. Contraste de Kruskal-Wallis.Inferencia en tablas de contingencia. Interpretación.Medidas de asociación para tablas de contingencia. Pruebas de Hipótesis de homogeneidad de proporciones.

    Práctico Nº 9: Análisis de la varianzaContenidos: La tabla de ANAVA. Supuestos del ANAVA. Análisis de los residuales.

    Preuebas a Posteriori. Test de Tukey y Fisher.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    11/214

    11

    Programa de Examen F inal(COMBINADO)

    Bolilla Nº 11.1 Necesidad y finalidad de la Investigación. Población y Muestra.1.2 Espacio muestral. Eventos. Concepto de Probabilidad.1.3 La función de densidad normal. Estandarización.1.4 Estimación puntual. Propiedades de los buenos estimadores.1.5 Concepto de prueba de Hipótesis.1.6 Prueba de Hipótesis acerca de la esperanza de una distribución cuando se conoce2.

    Estimación por intervalos para la esperanza de una distribución normal cuando se conoce2.

    1.7 Análisis de Regresión Lineal.1.8 Pruebas No Paramétricas. Tablas de Contingencia.1.9 ANAVA: Definiciones preliminares.

    Bolilla Nº 2 2.1 Variables. Tipos de variables.2.2 Evento Aleatorio. Concepto de variable aleatoria.2.3 Función de distribución acumulada normal. Uso de la tabla para distribución normal.2.4 Estimación por intervalo. Procedimiento general para encontrar un intervalo de confianza

    para un parámetro distribucional.2.5 Hipótesis Nula y Alternativa.2.6 Prueba de hipótesis acerca de la esperanza de una distribución normal cuando2 es

    desconocida. Estimación por intervalos para la esperanza de una distribución normal

    cuando2

    es desconocida.2.7 Estimación de la Recta de Regresión.2.8 Test de Rachas. Medidas de Asociación para tablas de contingencia.2.9 Diseño completamente aleatorizado

    Bolilla Nº 3 3.1 Distribuciones de frecuencia de una variable aleatoria.3.2 Distribución de una variable aleatoria. Función de distribución acumulada.3.3 Distribución del Estadístico media muestral.3.4 Interpretación del intervalo de confianza.3.5 Procedimiento de la prueba de Hipótesis.3.6 Contraste de hipótesis referente a la varianza de una distribución normal.3.7 Regresión: Método de los Mínimos Cuadrados.3.8 Test de D‘Agostino.Hipótesis de homogeneidad de proporciones para tablas de

    contingencia.3.9 El análisis de la varianza de efectos fijos a un criterio de clasificación.Bolilla Nº 4 4.1 Representaciones gráficas de los resultados de estudios experimentales u observacionales.4.2 Función de densidad para variables aleatorias discretas y continuas.4.3 Teorema central de límite.4.4 Estimación por intervalo de la esperanza de la distribución de una variable aleatoria

    normal.4.5 Errores de Tipo I y Tipo II.4.6 Estimación por intervalo de la varianza de una distribución.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    12/214

  • 8/15/2019 Estadística y Diseño Experimental 2011

    13/214

    13

    Estadística y BiometríaEstadística:

    ¿relación de datos numéricos presentada de forma ordenada y sistemática? Es algo más: permite dar luz y obtener resultados, y por tanto beneficios, en

    cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidadintrínseca, no puedan ser abordadas desde la perspectiva de las leyesdeterminísticas.

    Ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor sitenemos en cuenta que los quehaceres y decisiones diarias embargan cierto gradode incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nosorienta para tomar las decisiones con un determinado grado de confianza.

    Definición 1: Ciencia que estudia cómo debe emplearse la información y cómo dar una guía de

    acción en situaciones prácticas que entrañan incertidumbre.Usos y Abusos

    Los críticos de la estadística afirman que a través de ella es posible probarcualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia eneste campo y de lo polifacético de los métodos estadísticos.

    Muchos "investigadores" tendenciosos han cometido abusos con la estadística,elaborando "investigaciones" de intención, teniendo previamente los resultados queles interesan mostrar a personas ingenuas y desconocedoras de los hechos.

    Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelosinapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracasode sus investigaciones.

    L incoln L . Chao (Estadística para Ciencias Admi ni strativas, en Bibli oteca) , hace

    referencia a uno de los más estruendosos fracasos, debido a los abusos en la toma de unamuestra

    Se trata del error cometido por la Digest que, en sus pronósticos para las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría161 votos electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523votos y a Landon con 8 solamente.

    El error se debió a que la muestra fue tomada telefónicamente a partir de la lista desuscriptores de la Digest y, en 1936, las personas que se daban el lujo de tenerteléfonos y suscripciones a revistas no configuraban una muestra representativa delos votantes de EE.UU. y, por ende, no podía hacerse un pronóstico confiable con

    tan sesgada información.

    División

    La estadística se divide en dos grandes ramas de estudio que son: Estadística descr ipti va Estadística matemáti ca o inferencial

  • 8/15/2019 Estadística y Diseño Experimental 2011

    14/214

    14

    Estadística Descriptiva o Deductiva

    Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficosque resumen y presentan la información contenida en ellos.

    Estadística Inferencial o InductivaApoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúaestimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayorde datos.Desarrolla modelos teóricos que se ajusten a una determinada realidad con cierto grado deconfianza.Cuando se realiza un estudio de investigación, se pretende generalmente inferir ogeneralizar resultados de una muestra a una población.Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad.

    Individuos, Población y Muestra

    Individuos o elementos: personas u objetos que contienen cierta información que sedesea estudiar.

    Población: representa el conjunto grande de individuos que deseamos estudiar ygeneralmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo quereúne unas características determinadas.

    Muestra: La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que realizamos las mediciones o elexperimento con la idea de obtener conclusiones generalizables a la población )

    La muestra debe ser representativa de la población y con ello queremos decir quecualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido.

    ¿Por qué estudiar muestras?

    Ahorra tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. Como consecuencia del punto anterior ahorraremos costos. Estudiar la totalidad de los elementos o personas con una característica

    determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de

    realizar. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, lasobservaciones y mediciones realizadas a un reducido número de individuos puedenser más exactas y plurales que si las tuviésemos que realizar a una población.

    La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de inclusión y/o exclusión.

    En Resumen Individuos o elementos : personas u objetos que contienen cierta información que

    se desea estudiar. Población : conjunto de individuos o elementos que cumplen ciertas propiedades

    comunes. Muestra : subconjunto representativo de una población.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    15/214

    15

    Parámetro : función definida sobre los valores numéricos de característicasmedibles de una población.

    Estadístico : función definida sobre los valores numéricos de una muestra.

    Ejemplo Consideremos la población formada por todos los estudiantes de la UNLaR. Laaltura media de todos los estudiantes es el parámetro μ. El conjunto formado por

    los alumnos de la Sede Chamical es una muestra de dicha población y la alturamedia de esta muestra, , es un estadístico.

    Organización de DatosVARIABLES

    Toda magnitud cuya medida puede cambiar de valor recibe el nombre de variable.Algunas de ellas son absolutamente predecibles con exactitud: son las variablesdeterminísticas.

    Por ejemplo el área de un cuadrado (figura geométrica) de 20 cm de lado es 400cm2

    A = L2 En la realidad, el problema no es tan sencillo, la medición del área de una baldosa

    aproximadamente cuadrada, de aproximadamente 20 cm de lado, puede dar comoresultado: 399, 400 ó 401 cm2. Incluso en mediciones repetidas de la misma baldosa. Esto puede deberse a varias causas : irregularidad de la baldosa ,dilatación o contracción debida a la temperatura, errores humanos o instrumentalesen la medición u otras absolutamente desconocidas. Este fenómeno genera lasvariables llamadas aleatorias ( probabilísticas o estocásticas)

    A = L2

    + ε donde épsilon es el desvío no explicado respecto al valor esperado L2

    Variables Estadísticas ► Es una característica o propiedad determinada del individuo o elemento, sea

    medible o no. Esta propiedad hace que los elementos de un grupo puedan diferir delas de otro grupo en la muestra o población de estudio.

    ► Cuando hablemos de variable haremos referencia a un símbolo (X, Y, A, B,...) que puede tomar cualquier modalidad (valor) de un conjunto determinado, quellamaremos dominio de la variable o rango. En función del tipo de dominio, lasvariables las clasificamos del siguiente modo:

    Var iables cuali tativas o categór icas► Este tipo de variables representan una cualidad o atributo que clasifica a cada caso

    en una de varias categorías. La situación más sencilla es aquella en la que seclasifica cada caso en uno de dos grupos (hombre/mujer). Son datos dicotómicos o binarios.

    ► Como resulta obvio, en muchas ocasiones este tipo de clasificación no essuficiente y se requiere de un mayor número de categorías (color de los ojos, gruposanguíneo, profesión, etcétera).

    Dos Escalas ► Escalas Nominales

    ► Escalas Ordinales

    X

  • 8/15/2019 Estadística y Diseño Experimental 2011

    16/214

    16

    Nominal► ésta es una forma de observar o medir en la que los datos se ajustan por categorías

    que no mantienen una relación de orden entre sí

    Ordinal► son aquellas en la que es posible establecer un orden entre ellas.

    Ej: si estudiamos la llegada a la meta de un corredor en una competición de 20 participantes, su clasificación C es tal que:

    Var iables cuanti tativas► son las que tienen por modalidades cantidades numéricas con las que podemos

    hacer operaciones aritméticas. Dentro de este tipo de variables podemos distinguirdos grupos:

    Discretas ► cuando no admiten siempre una modalidad intermedia entre dos cualesquiera de

    sus modalidades. Suelen tomar solamente valores enteros (número de hijos,número de partos, número de hermanos, etc). Es obvio que cada valor de lavariable es un número natural.

    Continuas ►

    cuando admiten una modalidad intermedia entre dos cualesquiera de susmodalidades.Ej. el peso X de un niño al nacer. En este caso los valores de las variables son númerosreales, es decir:

    ► Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece comodiscreta. Este es el caso en que hay limitaciones en lo que concierne a la precisióndel aparato de medida de esa variable.

    Ej. si medimos la altura en metros de plantas con dos decimales de precisión, podemosobtener:

    ► En realidad lo que ocurre es que con cada una de esas mediciones expresamos queel verdadero valor de la misma se encuentra en un intervalo de radio 5.10-3. Por lotanto, cada una de las observaciones de X representa más bien un intervalo que unvalor concreto.

    Otras formas de clasificación► Variable Dependiente : es la v. motivo de nuestro interés, cuyos valores dependen

    de otras variables que pueden influir en ella. También se la llama v. de respuesta.Por ejemplo la sobrevida, respuesta al tratamiento, evolución, etc.

    ► Variable Independiente : es la que modifica de una u otra manera a la v.dependiente, llamándose también según el caso factor de riesgo, factor predictivo,etc.

    agrio"",amargo"",dulce""

    ,...,10,4,3,21C

    .53,....51,1.52,1...,1.50,1

  • 8/15/2019 Estadística y Diseño Experimental 2011

    17/214

    17

    ► Variable Asociada : se denomina así a aquella v. independiente que no modifica por su sola presencia a la v. dependiente, pero que al combinarse con otra variable,si influye notoriamente a la anterior.

    M odalidad - Clases► Las modalidades son las diferentes situaciones posibles que puede presentar la

    variable. (p. Ej. cuando una variable es continua) y conviene reducir su número,agrupándolas en una cantidad inferior declases .

    ► Estas clases deben ser construidas, tal como hemos citado anteriormente, de modoque seanexhaustivas e incompatibles , es decir, cada modalidad debe pertenecer auna y sólo una de las clases.

    Resumen ► Variable cualitativa nominal: Aquella cuyas modalidades son de tipo nominal. ► Variable cualitativa ordinal: Modalidades de tipo nominal, en las que existe un

    orden.► Variable cuantitativa discreta: Sus modalidades son valores enteros. ► Variable cuantitativa continua: Sus modalidades son valores reales.

    Tabl as estadísti casConsideremos una población estadística den individuos, descrita según un carácter ovariableC cuyas modalidades han sido agrupadas en un númerok de clases, quedenotamos mediantec1,c2,c3,...c k . Para cada una de las clasesci, i = 1,2,...,k , introducimoslas siguientes magnitudes:

    Frecuencia absoluta ► (de un determinado valor ni ) al número de veces que se repite dicho valor .Frecuencia relativa

    ► Es el cociente fi, entre las frecuencias absolutas de dicha clase y el número total deobservaciones, es decir:

    Frecuencia absoluta acumulada ► ( de un determinado valor ni ) a su frecuencia absoluta más la suma de las

    frecuencias absolutas de todos los valores anteriores

    Frecuencia relativa acumulada ► F i, se calcula sobre variables cuantitativas, siendo el tanto por uno de los elementos

    de la población que están en alguna de las clases y que presentan una modalidadinferior o igual a laci, es decir:

    ► Como todas las modalidades son exhaustivas e incompatibles ha de ocurrir que

    nn

    f i i

    i

    j jii nnnnn N

    1321 ...

  • 8/15/2019 Estadística y Diseño Experimental 2011

    18/214

    18

    o lo que es lo mismo

    Si las frecuencias relativas las multiplicamos por 100 obtenemos los %

    Distr ibución de frecuenci as► Llamaremosdistribución de frecuencias al conjunto de clases junto a las

    frecuencias correspondientes a cada una de ellas. Unatabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general esla siguiente:

    1n

    Fk = 1Nk = nn k ck

    ...............

    n jc j

    ...............

    N1 = n

    1n

    1c

    1

    FiNif in iC

    Frec. Rel. Acumulada

    Frec. Abs. Acumulada

    FrecuenciaRelativa

    Frecuencia Absoluta

    Variable

    1n

    Fk = 1Nk = nn k ck

    ...............

    n jc j

    ...............

    N1 = n

    1n

    1c

    1

    FiNif in iC

    Frec. Rel. Acumulada

    Frec. Abs. Acumulada

    FrecuenciaRelativa

    Frecuencia Absoluta

    Variable

    n

    n f 1

    1

    n

    n f j j

    nn

    f k k

    j j nnn N ...21

    j f n

    N F 11

    j j

    j f f n

    N F ...1

    Ejemplo – completar tabla

    li-1 -- li ni f i Ni

    0 -- 10 60 f1 60

    10 -- 20 n2 0,4 N2

    k

    ik i nnnnn

    121 ...

    k

    i

    k

    i

    k

    i ii

    nn

    n

    n

    nn

    f i1 1

    1 1

  • 8/15/2019 Estadística y Diseño Experimental 2011

    19/214

    19

    20 -- 30 30 f 3 170

    30 -- 100 n4 0,1 N4

    100 -- 200 n5 f 5 200

    n

    Sabemos que la última frecuencia acumulada es igual al total de observaciones, luego n =200. Como N3=170 y n3=30, entonces:

    N 2 = N 3-n3=170-30=140Además al sern

    1=60, tenemos que:

    n2 = N 2-n1=140-60=80Por otro lado podemos calcularn4 teniendo en cuenta que conocemos la frecuenciarelativa correspondiente:

    Así: N 4= n4+ N 3=20+170 =190

    Este último cálculo nos permite obtener:

    n5= N 5- N 4=200-190=10Al haber calculado todas las frecuencias absolutas, obtenemos las relativas:

    li-1 -- li ni f i Ni

    0 -- 10 60 0,3 60

    10 -- 20 80 0,4 140

    20 -- 30 30 0,15 170

    202001,0*444

    4 xn f nnn

    f

    05,020010

    15,0200

    30

    3,020060

    55

    3

    3

    11

    nn

    f

    n

    n

    f

    nn

    f

  • 8/15/2019 Estadística y Diseño Experimental 2011

    20/214

    20

    30 -- 100 20 0,1 190

    100 -- 200 10 0,05 200

    200

    Elección de las clases ► En cuanto a la elección de las clases, deben seguirse los siguientes criterios en

    función del tipo de variable que estudiemos:► Cuando se trate de variables cualitativas, las clasesci serán de tipo nominal► En el caso de variables cuantitativas, existen dos posibilidades:

    ► Si la variable es discreta, las clases serán valores numéricos x1,...xK Si la variable es continua las clases vendrán definidas mediante lo que denominamosintervalos . En este caso, las modalidades que contiene una clase son todos los valores

    numéricos posibles contenidos en el intervalo, el cual viene normalmente definido de laforma:

    o En estos casos llamaremosamplitud del intervalo a las cantidades:a i = l i -l i -1

    o y marca de clase ci, a un punto representativo del intervalo. Si éste es acotado,tomamos como marca de clase al punto más representativo:

    Elección de intervalos para variables continuas► Número de intervalos a elegir y sus tamaños respectivos.► La notación más común que usaremos para un intervalo es:

    ► El primer intervalo, l0 -- l1, podemos cerrarlo en el extremo inferior para no excluirla observación más pequeña, l0:

    ► El número de intervalos, k, a utilizar no está determinado de forma fija y por tantotomaremos un k que nos permita trabajar cómodamente y ver bien la estructura delos datos:

    iiii l xl xl l 11 :,

    21ii

    i

    l l c

    j j j j l l l l ,11

    1010 , l l l l

    casootroennlog22,31

    grandemuyesnonsi intervalos

    nk N

  • 8/15/2019 Estadística y Diseño Experimental 2011

    21/214

    21

    Ejemplo Si el número de observaciones que tenemos esn = 100, un buen criterio es agrupar lasobservaciones en intervalos. Sin embargo si tenemosn = 1.000.000, serámas razonable elegir intervalos, que

    ► La amplitud de cada intervalo:a i = l i -l i -1 suele tomarse constante, considerando laobservación más pequeña y más grande de la población ( ) para calcular la amplitud total, A, de la población:

    A = l k - l 0 de forma que la amplitud de cada intervalo sea:

    k A

    aa ii a dondek,...,2,1

    Observación► Podría ocurrir que la cantidad ―a” fuese un númeromuy desagradable a la hora de

    escribir los intervalosa = 10,325467). En este caso, es recomendable variarsimétricamente los extremos,l0 < x min < x max < l k , de forma que se tenga quea esun número más simple (Ej.a = 10).

    Ejemplo Sobre un grupo den = 21 terneros se realizan las siguientes observaciones de sus pesos,expresados en kilos:

    X~x1,x2,…,x21

    58 42 51 54 40 39 49

    56 58 57 59 63 58 6670 72 71 69 70 68 64

    ► En primer lugar hay que observar que si denominamos X a la variable ―peso decada ternero esta es una variable de tipo cuantitativa y continua. Por tanto a lahora de ser ordenados los resultados en una tabla estadística, esto se ha de haceragrupándolos en intervalos de longitud conveniente. Esto nos lleva a perder ciertogrado de precisión. Para que la perdida de información no sea muy relevanteseguimos el criterio de utilizar

    ► En este punto podemos tomar bienk = 4 o bienk = 5. Arbitrariamente se elige unade estas dos posibilidades. Por ejemplo, vamos a tomark = 5.

    ► Lo siguiente es determinar la longitud de cada intervalo,a i . Lo máscómodo es tomar la misma longitud en todos los intervalos,a i = a (aunque esto notiene por qué ser necesariamente así), donde:

    10100k 20nlog22,31k 000.1000.000.1k

    maxk min0 xlyxl

    21nk

    5,...,2,1i

  • 8/15/2019 Estadística y Diseño Experimental 2011

    22/214

    22

    7239

    333972

    6,65

    335

    max5

    min0

    05

    xl xl

    l l A

    Aa

    ► Entonces tomaremosk = 5 intervalos de longituda = 6,6 comenzando porl 1 = xmin = 39 y terminando enl 5=72:

    Intervalos M. clase f.a. f.r. f.a.a. f.r.a.

    li-1 -- li ci ni f i Ni Fi

    i=1 39 -- 45,6 42,3 3 0,1428 3 0,1428

    i=2 45,6 -- 52,2 48,9 2 0,0952 5 0,2381

    i=3 52,2 -- 58,8 55,5 6 0,2857 11 0,5238i=4 58,8 -- 65,4 62,1 3 0,1428 14 0,6667i=5 65,4 -- 72 68,7 7 0,3333 21 ≈ 1

    21 ≈ 1

    Representaciones Gr áficas A pesar de la gran ayuda que prestan las tablas y cuadros con información

    organizada, no todos los públicos alcanzan a comprenderla o no disponen deltiempo suficiente para analizarla.

    Es por ello que la mayoría de los investigadores acostumbran a reforzar ladescripción a través de dibujos, generalmente con formas geométricas, que ayudana visualizar el comportamiento de las variables tratadas.

    Definición Un gráfico o diagrama es un dibujo complementario a una tabla o cuadro, que permiteobservar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de lasvariables allí relacionadas.

    Componentes Título adecuado: El cual debe ser claro y conciso, que responda a las preguntas:

    Qué relaciona, cuándo y dónde se hicieron las observaciones. El cuerpo: o gráfico en sí, cuya elección debe considerar el o los tipos variables a

    relacionar, el público a quien va dirigido y el diseño artístico del gráfico. Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico, las

    escalas de los ejes, o se otorgan los créditos a las fuentes respectivas. Es de anotar que por medio de gráficos tendenciosos se pueden deformar o resaltar

    situaciones o estados, que presentados en un gráfico apropiado, mostrarían uncomportamiento normal.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    23/214

    23

    Generalmente una información es distorsionada por algunas de las siguientescausas: ejemplo

    La relación entre los ejes no es la más apropiada

    Variación de La Inflación en Argentina1995-2000

    Como se puede observar, el gráfico No.2 ―realza el decrecimiento de la variable inflación,

    El No.1 intenta mostrar una estabilización o decrecimiento parsimonioso. Los dos gráficosson incorrectos debido a que no conservan una proporción adecuada entre sus ejes.

    Este gráfico tiene una buena proporción entre los ejes.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    24/214

    24

    Pero, la distorsión se debe a la mala numeración en el eje ―Y pues, el punto de origen Oha sido eliminado y asignado un valor arbitrario, la escala es inadecuada para resaltar eldecrecimiento inflacionario de los dos últimos periodosLas situaciones observadas son erróneas o tendenciosas y se deben corregir asignando

    escalas apropiadas a los ejes y utilizando la siguiente regla:

    Donde: Lx: Longitud del eje horizontalLy: Longitud del eje vertical

    ―La longitud del eje vertical es igual a tres cuartos de la longitud del eje horizontal .

    Gráficos para variables cual itativas Diagramas de barras: representamos en el eje de las abscisas modalidades y en

    ordenadas las frecuencias absolutas o bien, las frecuencias relativas.

    0

    5

    10

    15

    20

    25

    30

    35

    40

    1er trim. 2do trim. 3er trim. 4to trim.

    Para comparar varias poblaciones entre sí, existen otras modalidades. Cuando lostamaños de las dos poblaciones son diferentes, es conveniente utilizar lasfrecuencias relativas.

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    1er trim. 2do trim. 3er trim. 4to trim.

    Este

    Oeste

    Norte

  • 8/15/2019 Estadística y Diseño Experimental 2011

    25/214

    25

    Diagramas de sector es También llamadostortas . Se divide un círculo en tantas porciones como clases

    existan, de modo que a cada clase le corresponde un arco de círculo proporcional asu frecuencia absolutas o relativas.

    1er trim. 2do trim. 3er trim. 4to trim.

    El arco de cada porción se calcula usando laregla de tres :

    nn

    xn

    n

    iii

    .360

    360

    Pictogramas Expresan con dibujos alusivo al tema de estudio las frecuencias de las modalidades

    de la variable. Estos gráficos se hacen representado a diferentes escalas un mismodibujo.

    Gráficos para vari ables cuanti tati vas

    Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función deque para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuenciasacumuladas.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    26/214

  • 8/15/2019 Estadística y Diseño Experimental 2011

    27/214

    27

    Gráficos para variables continuasCuando las variables son continuas, utilizamos como diagramas diferenciales loshistogramas y los polígonos de frecuencias .

    Histogramas Se construyen a partir de la tabla estadística, representando sobre cada intervalo, un

    rectángulo que tiene a este segmento como base.

    Pol ígonos de frecuenci as Se construyen fácilmente si tenemos representado previamente el histograma. Consiste en unir mediante líneas rectas los puntos del histograma que corresponden

    a las marcas de clase.

    Polígono de frecuencias acumulado El diagrama integral para una variable continua se denomina tambiénpolígono de

    frecuencias acumulado , y se obtiene como la poligonal definida en abscisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de lavariable, y en ordenadas por alturas que son proporcionales a las frecuenciasacumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma.

    0.0022 0.0030 0.0037 0.0045 0.0053 PS

    0.00

    0.17

    0.33

    0.50

    0.66

    frecuencia relativa

    0.0022 0.0030 0.0037 0.0045 0.0053 PS

    0.00

    0.17

    0.33

    0.50

    0.66

    frecuencia relativa

  • 8/15/2019 Estadística y Diseño Experimental 2011

    28/214

    28

    Ejemplo Intervalos ci ni Ni

    0 -- 2 1 2 22 -- 4 3 1 34 -- 6 5 4 76 -- 8 7 3 108 – 10 9 2 12

    12

    Gráfico de Líneas

    Usado básicamente para mostrar el comportamiento de una variable cuantitativa através del tiempo. Consiste en segmentos rectilíneos unidos entre sí, los cualesresaltan las variaciones de la variable por unidad de tiempo.

    Para su construcción ha de procederse de la siguiente manera: en el eje de lasordenadas se marcan los puntos de acuerdo con la escala que se esté utilizando. Enel caso de una escala aritmética, distancias iguales en el eje, representan distanciasiguales en la variable.

    Variación de La Inflación en Argentina1995-2000

  • 8/15/2019 Estadística y Diseño Experimental 2011

    29/214

    29

    El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente elnúmero de ítems que ha de presentarse, así como la longitud del eje. Es de anotar laconveniencia de mostrar la interrupción y acercamiento del eje a su origencuando esto haya ocurrido.

    Gráfico de Líneas Compuesto Cuando se tienen varias variables a representar, con el fin de establecer

    comparaciones entre ellas (siempre que su unidad de medida sea la misma); seutiliza plasmarlos en un sólo gráfico, el cual es el resultado de representar variasvariables en un mismo plano.

    Variación de la Inflación y el Salario

    Diagrama de barr as de error Paracomparar dos o más grupos se realiza habitualmente en términos de su valormedio, En el gráfico se compara el índice de masa corporal en una muestra dehombres y mujeres. Para cada grupo, se representa su valor medio, junto con su95% intervalo de confianza. El hecho de que dichos intervalos no se solapen, noimplica necesariamente que la diferencia entre ambos grupos pueda serestadísticamente significativa, pero sí nos puede servir para valorar la magnitud dela misma.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    30/214

    30

    Diagramas de dispersión Se confronta, en el eje horizontal, el valor de una variable y en el eje vertical el

    valor de la otra. Un ejemplo sencillo de variables altamente correlacionados es larelación entre el peso y la talla de un sujeto. En él gráfico puede observarseclaramente como existe una relación directa entre ambas variables, y valorar hastaqué punto dicha relación puede modelizarse por la ecuación de una recta. Este tipode gráficos son, por lo tanto, especialmente útiles en la etapa de selección devariables cuando se ajusta un modelo de regresión lineal.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    31/214

    31

    F unciones matemáti cas l ineales y cuadradas

    En matemáticas, muchos problemas comprenden conjuntos de pares ordenados denúmeros. Un conjunto de pares ordenados de números reales recibe el nombre de relación binaria. El conjunto de los primeros elementos de una relación binaria se llama dominio dela relación. El conjunto de los segundos elementos es el codominio o imagen de larelación. Para el conjunto (x, y) las cantidades de x e y suelen llamarse variables. Elconjunto de valores para la variablex es el dominio, yx suele llamarse variableindependiente, el conjunto de valores que toma la variable y es el codominio, y ay se ledenomina por lo general, variable dependiente. Cuando A partir del contexto, resulta claroel número de variables, una relación binaria puede llamarse sencillamente, relación.Si una relación es tal que en ella a cada elemento del dominio le corresponde uno y sólo unelemento del codominio, se dice que esta en relación de una función.La función es una regla matemática que asigna a cada valor de entrada uno y sólo un valorde salida.

    F unción l ineal y ecuación de la recta

    La construcción y lectura de gráficos son necesidades imprescindibles en el mundo actual. No es posible comprender un diario si no se tiene idea de cómo interpretar un gráfico.Como primer acercamiento observemos el siguiente gráfico que contiene informaciónsimple de leer.En las empresas ferroviarias se utilizan diagramas similares a estos para programar laseñalización a lo largo de la vía férrea.

    En el eje vertical se han marcado los puntos O, A, B, C, D, y E que son estacionesferroviarias. En el eje horizontal se ha representado el tiempo medido en horas. Cada líneaquebrada indica la posición del tren, cuyo número está marcado sobre la misma, enfunción del tiempo. Observemos que algunos trenes no llegan a la última estación y

    algunos no paran en ciertas estaciones.Veamos algunas preguntas que podemos hacer para interpretar el gráfico:1) ¿A qué hora sale el tren nº 2?

  • 8/15/2019 Estadística y Diseño Experimental 2011

    32/214

    32

    2) ¿A qué hora llega a la estación E el tren nº 4?3) ¿Cuánto tiempo transcurre entre la salida del tren nº 3 y el nº 4?4) ¿Cuánto tarda el tren nº 1 en ir de la estación O a la estación B?5) ¿Cuánto tiempo el tren nº 1 está detenido en la estación B?6) ¿Cuánto tiempo transcurre en la estación D desde la partida del tren nº 1 hasta que pasa

    el tren nº 6?7) ¿Hasta donde llega el tren nº 3?8) ¿A qué hora y en qué lugar se cruzan los trenes nº 1 y nº 2?9) Si un pasajero llega a la estación O a las 12:30 hs. y quiere llegar a la estación E, ¿quéopciones tiene?10) Si un pasajero llega a la estación O a las 10 hs. y toma el tren nº 3, ¿cómo hace parallegar a la estación E?. ¿A qué hora llega?. ¿Qué le hubiera convenido hacer para llegarantes?11) ¿Es siempre la misma la velocidad del tren nº 2?. ¿Y la del tren nº 1?. ¿En qué lugar esmayor?

    Como habíamos mencionado antes, una función es una regla que permite asignar a cadauno de los elementos ―x de un conjunto ―A un único elemento ―y de otro conjunto ―B .A diario tenemos ejemplos de estas asignaciones: el médico dosifica un antibiótico enfunción del peso del bebé, nos cobran el pasaje en función de la distancia recorrida, ladistancia recorrida es función de la velocidad alcanzada, etc.

    F unción l ineal como propiedad de los sistemas generales

    Una función es lineal cuando cumple todas estas propiedades:o Si aplicamos una entrada u1(x) obtenemos una salida particular y1(x)o

    Si aplicamos una entrada u2(x) obtenemos una salida particular y2(x)o Entonces si aplicamos u3(x)=c1u1(x)+c2u2(x) obtenemos una saliday3(x)=c1y1(x)+c2y2(x) para todos los pares de entradas u1(x) y u2(x) y para todoslos pares de constantes c1 y c2.

    Esto incluye también a las funciones lineales diferenciales.

    I nterpretación geométr ica

    http://es.wikipedia.org/w/index.php?title=Sistemas_generales&action=edit&redlink=1http://es.wikipedia.org/w/index.php?title=Sistemas_generales&action=edit&redlink=1

  • 8/15/2019 Estadística y Diseño Experimental 2011

    33/214

    33

    En el análisis matemático y en la geometría, una función lineal de una variable reales unafunción matemática de la forma:

    Donde m y b son constantes.Una función lineal de una única variable independiente x suele escribirse en la formasiguiente

    Que se conoce como ecuación de la recta en el plano xy.o m es denominada la pendiente de la recta.o b es la ordenada en el origen, el valor de y para x= 0, es el punto (0,b).

    Ejemplo en el plano xy

    En la figura se ven tres rectas, que corresponden a las ecuaciones lineales siguientes:

    En esta recta el parámetro m= 1/2, esto es el crecimiento de la recta es 1/2, cuandoaumentamos x en una unidad, y aumenta en 1/2 unidad, el valor de b es 1, luego la rectacorta el eje y en el punto y= 1La ecuación:

    Tiene el valor de la pendiente m= 1/2, igual que en el caso anterior, por eso estas dosrectas son paralelas, como el valor de b= -1, esta recta corta el eje de las y en el punto y= -1.La tercera ecuación, es:

    http://es.wikipedia.org/wiki/N%C3%BAmero_realhttp://es.wikipedia.org/wiki/N%C3%BAmero_real

  • 8/15/2019 Estadística y Diseño Experimental 2011

    34/214

    34

    la pendiente de la recta, el parámetro m= 2, indica que cuando el valor de x aumenta enuna unidad, el valor de y la hace en dos unidades, el corte con el eje y, lo tiene en y= 1,dado que el valor de b= 1.En el caso de una recta el valor de m se corresponde al ángulo de inclinación de la rectacon el eje de las x a través de la expresión:

    F unción cuadr ática

    De vital importancia en matemáticas y física es la función cuadrática o de segundo grado.Las funciones cuadráticas son las que responden a la forma y=ax2+bx+c. Su gráfica es una parábola. Las parábolas son gráficas simétricas respecto de un eje que pasa por el vértice.En su estudio es conveniente conocer la orientación de la parábola, los puntos de cortescon los ejes, tanto con el eje OX como con el eje OY y el vértice de la parábola.

    Gráficas de funciones cuadráticas.

    Dondea , b y c son constantes ya es distinto de 0.La representación gráfica en el planoXY haciendo:

    Esto es:

    Es una parábola vertical, orientada hacia arriba o hacia abajo según el signo dea .

  • 8/15/2019 Estadística y Diseño Experimental 2011

    35/214

    35

    Estudio de la funciónCorte con el eje y

    La función corta el eje y en el punto y = f(0), es decir, la parábola corta el eje y cuando xvale cero (0):

    lo que resulta:

    La función corta el eje y en el punto (0, c), siendo c el termino independiente de la función.

    Corte con el eje xLa función corta aleje x cuandoy vale 0:

    las distintas soluciones de esta ecuación de segundo grado, son los casos de corte con eleje x , que se obtienen por la expresión:

    Donde:

    se le llamadiscriminante , Δ:

  • 8/15/2019 Estadística y Diseño Experimental 2011

    36/214

    36

    Según el signo del discriminante podemos distinguir:

    Δ > 0, la ecuación tiene dos soluciones, por tanto la parábola cortara aleje x en dos puntos: x1 y x2.

    B2 – 4ac > 0 2 interseccionesEjemplo:Ecuación de la parábola:

    y = 2 x2 – 5 x + 1

    Δ = 0, la ecuación tiene una única solución en x1, la parábola solo tiene un punto en comúncon eleje x , el cual es el vértice de la función donde las dos ramas de la parábolaconfluyen.

    b2

    – 4ac = 0 1 intersecciónEjemplo:Ecuación de la parábola:

    y = x 2 + 6 x + 9

    Δ < 0, la ecuación no tiene solución real, y la parábola no corta aleje x . b2 - 4ac < 0 No hay intersecciónEjemplo:Ecuación de la parábola:

    y = – x 2 + 2 x – 3

    x

    y

    -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 120

    2

    4

    6

    8

    10

    12

    14

    x

    y

    -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12

    -4

    -2

    0

    2

    4

    6

    8

    10

  • 8/15/2019 Estadística y Diseño Experimental 2011

    37/214

    37

    Intersección con el eje X

    Para determinar las coordenadas de cada punto de intersección, si ésta existe, de la parábola con el eje X, debe resolverse la siguiente ecuación cuadrática:

    a x 2 + b x + c = 0

    La parábola tiene un y sólo un punto de intersección con el eje Y. Las coordenadas de ese punto son: ( 0 , c )

    Eje de simetría

    Cada parábola tiene un eje de simetría cuya ecuación es:

    ab x

    2

    Ejemplo: Determina la ecuación del eje de simetría de la parábola de ecuación:

    y = 3 x2 – 12 x + 7.

    Respuesta: La ecuación del eje de simetría es:

    23.2

    12 x

    x

    y

    -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12

    -6

    -4

    -2

    0

    2

    4

    6

    8

    x

    y

    -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12

    -10

    -8

    -6

    -4

    -2

    0

    2

    4

  • 8/15/2019 Estadística y Diseño Experimental 2011

    38/214

    38

    Vértice ( V )

    Toda parábola tiene un y sólo un vértice ( V ) de coordenadas:

    abca

    abv

    .4..4,

    .2

    2

    Ejemplo: Determina las coordenadas del vértice ( V ) de la parábola de ecuación:

    y = x2 + 2 x – 8

    Respuesta: Las coordenadas del vértice son:

    9,11.428.1.4

    ,1.22 2

    v

    Dominio de la función ( Dom f )

    El dominio de la función cuadrática es R .

    Dom f = R

    Recorrido de la función ( Rec f )

    El recorrido de la función cuadrática está determinado por:

    x

    y

    -14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 10 12 14

    -10

    -8

    -6

    -4

    -2

    0

    2

    4

    6

  • 8/15/2019 Estadística y Diseño Experimental 2011

    39/214

    39

    a > 0 Rec f =

    a < 0 Rec f =

    Un ejemplo de un fenómeno que se puede describir a través de una función cuadrática, esel siguiente: se lanza una pelota, desde el suelo, hacia arriba. Se quiere conocer la alturaalcanzada por la pelota en cada segundo contado a partir del momento en que fue lanzada.

    La función que permite obtener la altura de la pelota en cada segundo, es una funcióncuadrática que depende de la inclinación con la cual se lanzó y de la fuerza que se leimprimió al lanzamiento, de acuerdo a ciertas leyes de la Física.

    Si se obtiene, en un caso específico, la funciónf(x)=-2x2+8xentonces, en el instante inicial (0 segundos transcurridos) la pelota está en el suelo, esdecir, tiene altura igual a cero:f(0)=-2(0)2+8(0)=0

    Para saber cuál es la altura (en metros, por ejemplo, en este caso) de la pelota en el instanteen que ha transcurrido 1 segundo, se hace x=1 y se calculaf(1)=-2(1)2+8(1)=-2+8=6

    y cuando han transcurrido 2 segundos:f(2)=-2(2)2+8(2)=-8+16=8

    Puede hacerse una tabla como la que se muestra a continuación:0 01 62 83 64 0

    1) La pelota vuelve a caer al suelo a los 4 segundos de haber sido lanzada.

    2) La altura máxima la alcanza al haber transcurrido 2 segundos a partir de sulanzamiento.

    3) La velocidad de la pelota va disminuyendo desde que es lanzada hasta que llega a 8metros de altura (a los 2 segundos de su lanzamiento). Esto se puede ver al calcular lacantidad de metros que subió desde el segundo 0 hasta el segundo 1, que esf(1)-f(0)=6-0=6 metros,y compararla con la cantidad de metros que subió entre los segundos 1 y 2:

    f(2)-f(1)=8-6=2

    Luego ocurre algo curioso, entre los segundos 2 y 3, la pelota comienza a descender yrecorre exactamente 2 metros:

    ,4

    – 4 2

    abca

    a

    bca

    4

    – 4, –

    2

  • 8/15/2019 Estadística y Diseño Experimental 2011

    40/214

    40

    f(2)-f(3)=8-6=2

    Y entre los segundos 3 y 4 vuelve a recorrer la distancia que recorrió en el primer segundo:

    f(3)-f(4)=6-0=6

    esto se refleja gráficamente en la simetría de la curva con respecto a la recta vertical x=2.

    Decir que esta curva es simétrica respecto a la recta x = 2, significa que si se rotara el plano tomando la recta como eje, de manera que todo lo que está a la izquierda de la recta pase a la derecha y viceversa, se obtendría una curva idéntica a la original.En otras palabras, si un observador imaginario, diminuto, se situara en algún punto de la

    recta, lo que vería de la curva al mirar hacia la izquierda, sería idéntico a lo que vería a suderecha.En términos algebraicos, se tiene que la imagen, por medio de la función f (x)= -2x2+8x ,de dos números que estén a la derecha y a la izquierda de 2 y a la misma distancia de 2,debe ser la misma.Por ejemplo, los números 1/2 y 7/2 son equidistantes de 2, pues

    Y sus imágenes son iguales:

  • 8/15/2019 Estadística y Diseño Experimental 2011

    41/214

    41

    M edidas descripti vas estadísticas• Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que

    junto a una medida que indique el valor alrededor del cual se agrupan los datos, seasocie una medida que haga referencia a la variabilidad que refleje dichafluctuación.

    • La tendencia central de los datos.• La dispersión o variación con respecto a este centro.• Los datos que ocupan ciertas posiciones .• La simetría de los datos.• La forma en la que los datos se agrupan.

    Medidas representativas de un conjunto de datos estadísticos

    Estadísticos de tendencia central• la media • la mediana • la moda

    En ciertas ocasiones estos tres estadísticos suelen coincidir, aunque generalmente no es así.

    Cada uno de ellos presenta ventajas e inconvenientes.La Media• Es la medida mas popular.

    • Es decir, tenemos una muestra de n observaciones: x1, x2,…,xn. Sumediamuestral es:

    • De forma compacta:

    Suma de las observacionesNúmero de observaciones

    Media =

    n)x...xx( n21 x

    n

    1iixn

    1 x

  • 8/15/2019 Estadística y Diseño Experimental 2011

    42/214

    42

    Propiedades de la media• La suma de los desvíos de los valores de la variable, calculado con respecto de la

    media aritmética es = 0

    • La media aritmética del producto de una constante por una variable es = a laconstante por la media aritmética de la variable:

    • La media aritmética de la suma de dos variables es = a la suma de sus respectivasmedias aritméticas:

    M ediana• Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra

    (un 50% de valores son inferiores y otro 50% son superiores).• Los datos deben ordenarse de menor a mayor• No presentan el problema de estar influido por los valores extremos, pero en

    cambio no utiliza en su cálculo toda la información de la serie de datos (no ponderacada valor por el número de veces que se ha repetido).

    Ejemplo:Los salarios de siete empleados fueron los siguientes (en miles de $) :28, 60, 26, 32, 30, 26, 29.¿Cuál es la mediana?Nro. de observaciones es impar Primero, ordenar los salarios.Luego, localizar el valor en el medio.26,26,28,29,30,32,60

    Supongamos que se agrega al grupo el Salario de un empleado más ($31.000).¿Cuál es la mediana?Nro. de observaciones es par Primero, ordenar los salarios.Luego, localizar el valor en el medio.

    Hay dos valores en el medio!26,26,28,29, 29.5 , 30,31,32,60

  • 8/15/2019 Estadística y Diseño Experimental 2011

    43/214

    43

    Moda• Es el valor de la variable que más se repite en la muestra.

    El gerente de una tienda de ropa posee la siguiente información sobre el talle de los pantalones que se vendieron ayer:31, 34, 36, 33, 28, 34, 30, 34, 32, 40.

    La Moda es 34

    En muchos casos, la moda nos da información mas valiosa que la mediana: 33.2.

    Ejemplo• Vamos a utilizar la distribución de frecuencias con datos de la estatura (altura a la

    cruz) de los terneros de un lote a remate.

    Variable Frecuenciasabsolutas Frecuenciasrelativas (Valor) Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%

    1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%

    Media aritmética :

    • Luego:

    • Por lo tanto, la estatura media de este grupo de es de 1,253 cm.

    Mediana : La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de

    los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna defrecuencias relativas acumuladas.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    44/214

    44

    Variable Frecuenciasabsolutas

    Frecuenciasrelativas

    (Valor) Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3%

    1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%

    Como el valor 1,26 se repite en 3 ocasiones, la media se situaría exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra ladivisión entre el 50% inferior y el 50% superior.

    Moda : Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tantoesta seria cuenta con 3 modas.

    Variable Frecuenciasabsolutas

    Frecuenciasrelativas

    (Valor) Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%

    1,28 4 24 13,3% 80,0%1,29 3 27 10,0% 90,0%1,30 3 30 10,0% 100,0%

    Media y Mediana • La media es sensible a observaciones extremas y a outliers.

    • La mediana solo es sensible a cambios en su entorno que la cruzan. Por ello, sedice que la mediana es un estimador robusto de la tendencia central.

    • La media y la mediana de una distribución simétrica se encuentran muy cerca. Sila distribución esexactamente simétrica, la media y la mediana coinciden.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    45/214

  • 8/15/2019 Estadística y Diseño Experimental 2011

    46/214

    46

    – Percentiles frecuentemente utilizados• Primer decil = percentil 10• Primer cuartil,Q1, = percentil 25• Segundo cuartil,Q2 , = percentil 50• Tercer cuartil,Q3 , = percentil 75

    • Noveno decil = percentil 90• En el caso de una variable continua, el intervalo donde se encuentra iik l l P 1

    se calcula buscando el que deja debajo de si alk% de las observaciones. Dentro deél, P k se obtiene según la relación:

    Deciles

    • Se definen como los valores de la variable que dividen a las observaciones en 10grupos de igual tamaño.

    • Más precisamente, definimos D1, D2, ..., D9 como:

    Ejemplo

    • Dada la siguiente distribución en el número de crías de cien perras, calcular suscuartiles

    xi ni Ni

    0 14 141 10 242 15 393 26 654 20 85

    5 15 100

    n = 100

  • 8/15/2019 Estadística y Diseño Experimental 2011

    47/214

    47

    Solución

    M edidas de dispersión

    • En el análisis estadístico no basta el cálculo e interpretación de las medidas detendencia central o de posición, ya que, por ejemplo, cuando pretendemosrepresentar toda una información con la media aritmética, no estamos siendoabsolutamente fieles a la realidad, pues suelen existir datos extremos inferiores ysuperiores a la media aritmética.

    Ampli tud (A) o Rango

    Rango • Una manera de medir la dispersión es calcular el recorrido de la distribución

    empírica, es decir, la diferencia entre las observaciones máxima y mínima.• Su mayor ventaja es que se puede calcular facilmente, sin embargo, no brinda

    información sobre la dispersión existente entre ambos valores extremos.• El rango depende sólo de las observaciones máxima y mínima, que podrían ser

    observaciones atípicas.• Podríamos mejorar nuestra descripción de la dispersión fijándonos, por ejemplo,

    también en la dispersión del 50% de los valores centrales de nuestros datos.

    • Un conjunto de estadísticos de utilidad son los cuartiles de una distribución.Ejemplo :

    muestra:4, 4, 5, 7, 8, 9

    Solución:• dato mayor H = 9• dato menor L = 4• A = 9 — 4 = 5

    • La amplitud señala que los 6 datos se encuentran dentro de una distancia de 5

    unidades en la recta numérica.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    48/214

    48

    Rango intercuartílico

    Es la diferencia entre el percentil 75% y el percentil 25%

    Diagrama de caja • Los cinco números resumen de una distribución son representados gráficamente

    por undiagrama de caja .

    • L - Observación máxima• Q3 - Tercer cuartil• Q2 - Mediana• Q1 - Primer cuartil• S - Observación mínima

    • Los lados inferior y superior de la caja van del primer al tercer cuartil. Por tanto, laaltura de la caja es la amplitud del 50% de los datos centrales.

    • El segmento del interior de la caja indica la mediana. Los extremos de lossegmentos perpendiculares a los lados superior e inferior indican, respectivamente,los valores máximo y mínimo de la distribución.

    S Q 1 Q2

    Q3

    L

    0 50

    100 150 200 250 300 350 Facturacion_sucursales_zona_norte

    0 40 80

    120 160 200 240

    Facturacion_sucursales_zona_sur

  • 8/15/2019 Estadística y Diseño Experimental 2011

    49/214

    49

    Varianza

    • La varianza , S2, se define como la media de las diferencias cuadráticas den puntuaciones con respecto a su media aritmética, es decir:

    Para datos agrupados en tablas, usando las notaciones establecidas anteriormente, lavarianza se puede escribir como

    Desviación estándar

    • La varianza no tiene la misma magnitud que las observaciones (ej. si lasobservaciones se miden en metros, la varianza lo hace en m2). Si queremos que lamedida de dispersión sea de la misma dimensionalidad que las observaciones bastará con tomar su raíz cuadrada. Por ello se define ladesviación estándar , S,como

    Grados de liber tad

    • ¿Por qué calculamos la varianza dividiendo por n - 1, en lugar de dividir por n?• Como la suma de las desviaciones es 0, la última desviación es una combinación

    lineal de las n - 1 desviaciones restantes.• Por lo tanto, no estamos calculando el promedio de n números independientes (los

    desvíos). Solo n -1 de las desviaciones al cuadrado pueden variar libremente y porello, promediamos la suma de los desvíos al cuadrado dividiendo por n -1.

    • Al numero n -1 se lo denominagrados de libertad de la varianza o de ladesviación típica.

    Ejemplo

    • Calcular la varianza y desviación estándar de las siguientes cantidades medidas enmetros:

    3,3,4,4,5

    Solución• Para calcular dichas medidas de dispersión es necesario calcular previamente elvalor con respecto al cual vamos a medir las diferencias. Ésta es la media:

    1n)xx(...)xx()xx(s

    2n22212

    2i

    2 )xx(1n

    1s

    1

    n i1

    2

    2

    n

    x xS

    n

    ii

  • 8/15/2019 Estadística y Diseño Experimental 2011

    50/214

    50

    La varianza es:

    siendo la desviación estándar su raíz cuadrada:

    “La desviación estándar y la varianza son las medidas de separación con respecto a lamedia

    Pr opiedades del desvío standard• S mide la dispersión respecto a la media. Debe emplearse solo cuando se escoge la

    media como medida central de la distribución.• S = 0 solo ocurre cuando no hay dispersión: todas las observaciones toman el

    mismo valor. De lo contrarioS > 0.• Cuanto más dispersión hay entre las observaciones, mayor es s.• S , al igual que la media, se encuentra fuertemente influenciado por las

    observaciones extremas.

    Descripción de una distribución asimétrica

    • Una distribución asimétrica con unas pocas observaciones en la cola larga de ladistribución tendrá un desvío standard grande. En tal caso, s no proporcionainformación útil sobre la dispersión de la distribución.

    • Como en una distribución muy asimétrica la dispersión de cada una de las colas esmuy distinta, es imposible describir bien la dispersión con un solo número.

    • Los cinco números resumen proporcionan mejor información sobre la dispersión dela distribución.

    • Es preferible utilizar los cinco números resumen en lugar de la media y el desvío standard para describir una distribución asimétrica

    Coeficiente de Var iación

    • El coeficiente de variación es una medida de dispersiónrelativa. • Muestra la dispersión de una distribución en relación a su media.

    • Se utiliza para comparar distintas distribuciones.• Su fórmula es:

    x

    σCV

  • 8/15/2019 Estadística y Diseño Experimental 2011

    51/214

    51

    • Por ejemplo, un desvio standard de 10, puede ser grande si la media es 100, pero nolo es si la media es 500.

    Ejemplo

    • Comparamos pesos de elefantes y ratas:

    Asimetr ía o sesgo

    • Asimetría: El concepto de asimetría se refiere a si la curva que forman los valoresde la serie presenta la misma forma a izquierda y derecha de un valor central(media aritmética)

    Coeficiente de asimetría de Pearson

    S M x

    S ed KP 3

    • SKP = 0 Distribución simétrica; existe la misma concentración de valores a laderecha y a la izquierda de la media.

    • SKP > 0 Distribución a simétrica positiva; existe mayor concentración de valoresa la derecha de la media que a su izquierda.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    52/214

    52

    • SKP < 0 Distribución a simétrica negativa; existe mayor concentración de valoresa la izquierda de la media que a su derecha.

    Apuntamiento (Cur tosis)

    • El Coeficiente de Curtosis analiza el grado de concentración que presentan losvalores alrededor de la zona central de la distribución.

    Distribución Mesocúrtica

    • Presenta un grado de concentración medio alrededor de los valores centrales de lavariable (el mismo que presenta una distribución normal).

    Distribución Leptocúrtica

    • Presenta un elevado grado de concentración alrededor de los valores centrales de lavariable.

  • 8/15/2019 Estadística y Diseño Experimental 2011

    53/214

    53

    Distribución Platicúrtica• Presenta un reducido grado de concentración alrededor de los valores centrales de

    la variable.

    Coeficiente de Curtosis

    31

    1

    22

    4

    2

    ii

    ii

    n x xn

    n x xn g

    • g2 = 0 (distribución mesocúrtica).• g2 > 0 (distribución leptocúrtica). • g2 < 0 (distribución platicúrtica).Ejemplo

    Vamos a calcular el Coeficiente de Curtosis de la serie de datos referidos a la estatura(altura a la cruz) de los terneros de un lote a remate visto anteriormente.

    Variable Frecuenciasabsolutas Frecuenciasrelativas

    (Valor) Simple Acum Simple Acum 1,20 1 1 3,3% 3,3%1,21 4 5 13,3% 16,6%1,22 4 9 13,3% 30,0%1,23 2 11 6,6% 36,6%1,24 1 12 3,3% 40,0%1,25 2 14 6,6% 46,6%1,26 3 17 10,0% 56,6%1,27 3 20 10,0% 66,6%1,28 4 24 13,3%