proyecto estadística espol 2 parcial

Post on 04-Jul-2015

2.665 Views

Category:

Education

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis Estadístico

TRANSCRIPT

qwertyuiopasdfghjklzxcvbnmqwerty

uiopasdfghjklzxcvbnmqwertyuiopasd

fghjklzxcvbnmqwertyuiopasdfghjklzx

cvbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfg

hjklzxcvbnmqwertyuiopasdfghjklzxc

vbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfg

hjklzxcvbnmqwertyuiopasdfghjklzxc

vbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

opasdfghjklzxcvbnmqwertyuiopasdfg

hjklzxcvbnmrtyuiopasdfghjklzxcvbn

mqwertyuiopasdfghjklzxcvbnmqwert

yuiopasdfghjklzxcvbnmqwertyuiopas

dfghjklzxcvbnmqwertyuiopasdfghjklz

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

INSTITUTO DE CIENCIAS MATEMÁTICAS

“ESPOL, Algunas Características de los Estudiantes de Estadística para

Ingenierías: Un Análisis Estadístico”

2

CONTENIDO

Contenido CONTENIDO ............................................................................................................................................. 2

1. INTRODUCCIÓN ........................................................................................................................... 3

1.1. DE QUÉ SE TRATA EL PROYECTO .................................................................................................... 3

1.2. OBJETIVO ........................................................................................................................................ 3

1.3. MARCO TEÓRICO ............................................................................................................................ 3

2. ANÁLISIS ESTADÍSTICO ......................................................................................................... 6

2.1 TABLA DE FRECUENCIAS .......................................................................................................................... 7

2.2 GRÁFICOS DE LAS VARIABLES ................................................................................................................ 11

2.3 MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN, POSICIÓN Y SESGO ..................................................... 23

3. MATRIZ DE COVARIANZAS Y CORRELACIÓN .................................................................. 59

3.1 DETERMINACIÓN DE LA MATRIZ DE VARIANZAS Y COVARIANZAS MUESTRAL S .................................. 59

3.2 DETERMINACIÓN DE LA MATRIZ DE CORRELACIÓN MUESTRAL R. ........................................................ 60

4. ESTADÍSTICA INFERENCIAL ................................................................................................. 61

4.1 INTERVALOS DE CONFIANZA .................................................................................................................. 61

4.2 PRUEBAS DE HIPÓTESIS PARA MEDIAS. ................................................................................................... 70

4.3 INTERVALOS DE CONFIANZA VARIANZAS ............................................................................................... 75

4.4 PRUEBAS DE HIPÓTESIS PARA VARIANZAS ............................................................................................. 81

4.5 BONDAD DE AJUSTE ............................................................................................................................... 87

4.6 TABLAS DE CONTINGENCIA .................................................................................................................... 94

5. CONCLUSIONES........................................................................................................................ 101

6. RECOMENDACIONES ............................................................................................................... 102

7. BIBLIOGRAFÍA .......................................................................................................................... 103

3

1. Introducción

1.1. De qué se trata el proyecto

Al comienzo del semestre a todos los alumnos que cursábamos estadística nos hicieron llenar un

formulario en el que nos preguntaba cosas de cada uno como nuestros gustos o información

personal; con todos los formularios se obtuvo una población de 305 (estudiantes) de las cuales

tomamos una muestra de 100 y de esta muestra hicimos el respectivo análisis de algunas de

estas preguntas (variables).

1.2. Objetivo

Poder diferenciar entre Población y Muestra además de, Parámetro Poblacional y Estimadores

Muéstrales.

Utilizar los conocimientos adquiridos en clase para realizar los diferentes literales que se piden

en el proyecto.

Desarrollar habilidades de análisis crítico y matemático en la materia de ESTADÍSTICA.

Realizar proyectos estadísticos de carácter serio y beneficioso para la sociedad.

1.3. Marco teórico

En el proyecto que se presenta a continuación se va a constar de diferentes términos estadísticos

los cuales, debemos tener muy claro su definición.

Entre estos tenemos:

Población

El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal.

Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan

características comunes.

En este caso la población consistirá en 270 elementos que crearemos a partir de la formula

proporcionada por el ejercicio.

El tamaño que tiene una población es un factor de suma importancia en el proceso de

investigación estadístico, y este tamaño vienen dado por el número de elementos que constituye

una población puede ser finita o infinita. Cuando el número de elementos que integra una

población es muy grande, se puede considerar a esta como una población infinita, por ejemplo;

el conjunto de todos los números positivos. Una población finita es aquella que está formada

por un limitado número de elementos.

Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si

estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se

examina una pequeña parte del grupo llamada muestra.

4

Muestra

Se llama muestra a una parte de la población a estudiar qué sirve para representarla.

El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y

lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía

permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede

elevar el nivel de calidad.

En nuestro caso, tomaremos una muestra de 100 elementos escogidos al azar para realizar el

estudio además de establecer una relación entre la muestra y la población a fin de comparar

datos y encontrar alguna tendencia si es que esta existe.

Una muestra representativa contiene las características relevantes de la población en las mismas

proporciones que están incluidas en tal población.

Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer

referencia sobre la población que está representada por la muestra.

En consecuencia muestra y población son conceptos relativos. Una población es un todo y una

muestra es una fracción o segmento de ese todo.

Variable Aleatoria

Este es un elemento muy importante en nuestro proyecto ya que nos permitirá realizar estudios

tanto a la población como a la muestra. En nuestro proyecto procederemos a trabajar con tres

diferentes variables aleatorias.

Una variable aleatoria es aquella que asume diferentes valores a consecuencia de los resultados

de un experimento aleatorio.

Estas variables pueden ser discretas o continuas. Si se permite que una variable aleatoria adopte

solo un número limitado de valores, se le llama variable aleatoria discreta. por el contrario, si se

le permite asumir cualquier valor dentro de determinados límites, recibe el nombre de variable

aleatoria continua.

Función de probabilidad

Una distribución la podemos concebir con una distribución teórica de frecuencia, es decir, es

una distribución que describe como se espera que varíen los resultados. Dado que esta clase de

distribuciones se ocupan de las expectativas son modelos de gran utilidad para hacer inferencias

y tomar decisiones en condiciones de incertidumbre.

Media

En estadística, la media es una medida de centralización. Se llama media de una distribución de

estadística a la media aritmética de los valores de los distintos individuos que la componen.

Varianza

Esta medida se basa en la cuantificación de las distintas de los datos con respecto al valor de la

media.

5

Moda

Es el valor que ocurre con mayor frecuencia en una muestra puede ser que no exista la moda y

también es posible que exista más de una moda.

Mediana

Una mediana es el valor de la variable que deja el mismo número de datos antes y después que

él una vez ordenados estos.

Matriz correlación

Es una representación ordenada de los coeficientes de correlación de cada variable con la otra

variable y consigo misma.

Histograma

Es la manera más común de representar gráficamente la distribución de frecuencias de los datos.

Se lo construye dibujando rectángulos cuya base corresponda a cada intervalo de clase y su

altura, según el valor de la frecuencia.

Diagrama de Caja

Es un diagrama grafico que se usa para expresar en forma resumida, algunas medidas

estadísticas de posición.

El diagrama de caja describe gráficamente el rango de los datos, el rango intercuartílico, los

valores extremos y la ubicación de los cuartiles. Es una representación útil para comparar

grupos de datos.

Intervalos de Confianza

Un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se

encuentra el verdadero valor del parámetro, con una probabilidad determinada. La probabilidad

de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina

nivel de confianza.

Nivel de significancia

La probabilidad de equivocarnos se llama nivel de significancia.

Variables cualitativas

Son las variables que expresan distintas cualidades, características o modalidad. Cada

modalidad que se presenta se denomina atributo o categoría y la medición consiste en una

clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales.

Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores

posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más

valores. Dentro de ellas podemos distinguir:

6

Variable cualitativa ordinal: También llamada variable cuasi cuantitativa. La variable

puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es

necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado,

grave.

Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un

criterio de orden como por ejemplo los colores o el lugar de residencia.

Variables cuantitativas

Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas

además pueden ser:

Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala

de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de

valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El

número de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un

intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,) o la altura

(1,64 m, 1,65 m, 1,66 m, ), que solamente está limitado por la precisión del aparato

medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.

2. Análisis Estadístico

NOMBRES Y CARACTERISTICAS DE LAS VARIABLES DE INTERES

Para nuestro análisis hemos escogido variables del tipo cualitativo y cuantitativo.

Nombres de las variables:

Sexo

Edad

Peso

Estatura

Materias tomadas

Materias aprobadas

Redes sociales

Horas semanales que utiliza la computadora

Minutos en llegar a la ESPOL

Horas semanales de ver televisión

Horas semanales que utiliza el internet

Internet en casa

7

2.1 Tabla de Frecuencias

Tabla de Frecuencia de la edad. (k=6)

0

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 19 21 ) 20 52 0.52 52 0.52

2 [ 21 23 ) 22 32 0.32 84 0.84

3 [ 23 25 ) 24 12 0.12 96 0.96

4 [ 25 27 ) 26 2 0.02 98 0.98

5 [ 27 29 ) 28 1 0.01 99 0.99

6 [ 29 31 ) 30 1 0.01 100 1

Tabla de Frecuencia de la estatura (k=6)

Clases

Marca

de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 152 158.5 ) 155.25 5 0.05 5 0.5

2 [158.5 165 ) 161.7 12 0.12 17 0.17

3 [165 171.5 ) 168.25 37 0.37 54 0.54

4 [171.5 178 ) 174.75 28 0.28 82 0.82

5 [178 184.5 ) 181.25 15 0.15 97 0.97

6 [184.5 191 ) 187.75 3 0.03 100 1

Tabla de Frecuencia de peso. (k=6)

8

Clases

Marca

de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 48.63 59.63 ) 54.13 21 0.21 21 0.21

2 [59.63 70.63) 65.13 38 0.38 59 0.59

3 [70.63 81.63) 76.13 23 0.23 82 0.82

4 [81.63 92.63 ) 87.13 14 0.14 96 0.96

5 [92.63 103.63 ) 98.13 1 0.01 97 0.97

6 [103.63 114.63) 109.13 3 0.03 100 1

Tabla de Frecuencia de las materias aprobadas (k=6)

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 12 20 ) 16 25 0.25 25 0.25

2 [ 20 28 ) 24 50 0.50 75 0.75

3 [ 28 36 ) 32 13 0.13 88 0.88

4 [ 36 44 ) 40 4 0.04 92 0.92

5 [ 44 52 ) 48 4 0.04 96 0.96

6 [ 52 60 ) 56 4 0.04 100 1

Tabla de Frecuencia de horas computador. (k=6)

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 0.5 3.5 ) 2 59 0.59 59 0.59

2 [ 3.5 6.5) 5 33 0.33 92 0.92

3 [ 6.5 9.5 ) 8 5 0.05 97 0.97

4 [ 9.5 12.5 ) 11 2 0.02 99 0.99

5 [ 12.5 15.5 ) 14 0 0 99 0.99

6 [ 15.5 18.5 ) 17 1 0.01 100 1

9

Tabla de Frecuencia de minutos a llegar (k=6)

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 15 38) 26.5 31 0.31 31 0.31

2 [ 38 61) 49.5 52 0.52 83 0.83

3 [ 61 84 ) 72.5 7 0.07 90 0.90

4 [84 107) 95.5 6 0.06 96 0.96

5 [ 107 130 ) 118.5 3 0.03 99 0.99

6 [ 130 153 ) 141.5 1 0.01 100 1

Tabla de Frecuencia de horas internet. (k=6)

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 1 11) 5.5 43 0.43 43 0.43

2 [ 11 22) 16.5 33 0.33 76 0.76

3 [ 22 33) 27.5 13 0.13 89 0.89

4 [ 33 44 ) 38.5 7 0.07 96 0.96

5 [ 44 55 ) 49.5 2 0.02 98 0.98

6 [ 55 66 ) 60.5 2 0.02 100 1

Tabla de Frecuencia de materias en semestre. (k=6)

10

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 2 3) 2.5 2 0.02 2 0.02

2 [ 3 4) 3.5 12 0.12 14 0.14

3 [ 4 5) 4.5 18 0.18 32 0.32

4 [ 5 6 ) 5.5 23 0.23 55 0.55

5 [ 6 7 ) 6.5 33 0.33 88 0.88

6 [ 7 8 ) 7.5 12 0.12 100 1

Tabla de Frecuencia de horas televisión. (k=6)

Clases

Marca de

Clase

Frecuencia

Absoluta(f

)

Frecuencia

Relativa(f/n)

F. Absoluta

Acumulada(F)

F. Relativa

Acumulada(F/n)

1 [ 0 7) 3.5 37 0.37 37 0.37

2 [ 7 14) 10.5 26 0.26 63 0.63

3 [ 14 21) 17.5 18 0.18 81 0.81

4 [ 21 28) 24.5 7 0.07 88 0.88

5 [ 28 35 ) 31.5 10 0.10 98 0.98

6 [ 35 42 ) 38.5 2 0.02 100 1

11

2.2 Gráficos de las variables

VARIABLE GÉNERO

La variable es cualitativa de carácter nominal, identificada por el sexo de los individuos

entrevistados. En nuestra muestra se presenta una ligera mayoría de hombres.

VARIABLE INTERNET EN CASA

Esta variable es cualitativa, podemos observar la grafica, en donde notamos claramente que la

mayoría de personas de esta muestra si tiene internet en su casa con un porcentaje del 73% y un

27% que no tiene.

87%

13%

Genero

masculino Femenino

SI73%

NO27%

Internet en casa

12

VARIABLE REDES SOCIALES

Esta variable es cualitativa, donde podemos observar que la grafica que la muestra tomada la

mayoría de personas tiene cuenta de facebook y que solo un 5% no tienen ninguna cuenta en

ninguna red social.

45%

11%

30%

9%

5%

REDES SOCIALES

FACEBOOK TWITTER Hi5 OTRAS NINGUNA

SI 87%

NO13%

FACEBOOK

SI 58%

NO42%

HI5

13

SI 22%

NO78%

TWITTER

SI 18%

NO82%

OTRAS

SI 9%

NO91%

NINGUNA

14

GRAFICAS DE LA VARIABLE EDAD

302826242220

40

30

20

10

0

Edad

Fre

cu

en

cia

Histograma de Edad

302826242220

Edad

Gráfica de caja de Edad

30282624222018

100

80

60

40

20

0

2Edad

Po

rce

nta

je a

cu

mu

lad

o

Media 20,94

Desv.Est. 1,895

N 100

Normal

Histograma de Edad

15

GRAFICAS DE LA VARIABLE PESO

1101009080706050

18

16

14

12

10

8

6

4

2

0

Peso

Fre

cu

en

cia

Histograma de Peso

120110100908070605040

Peso

Gráfica de caja de Peso

110100908070605040

100

80

60

40

20

0

5Peso

Po

rce

nta

je a

cu

mu

lad

o

Media 70,09

Desv.Est. 13,16

N 98

Normal

Histograma de Peso

16

GRAFICAS DE LA VARIABLE ESTATURA

190185180175170165160155

20

15

10

5

0

Estatura

Fre

cu

en

cia

Histograma de Estatura

190180170160150

Estatura

Gráfica de caja de Estatura

190185180175170165160155

100

80

60

40

20

0

4Estatura

Po

rce

nta

je a

cu

mu

lad

o

Media 170,7

Desv.Est. 7,395

N 100

Normal

Histograma de Estatura

17

GRAFICAS DE LA VARIABLE MATERIAS APROBADAS

564840322416

25

20

15

10

5

0

Materias_Aprobadas

Fre

cu

en

cia

Histograma de Materias_Aprobadas

605040302010

Materias_Aprobadas

Gráfica de caja de Materias_Aprobadas

5648403224168

100

80

60

40

20

0

8Materias_Aprobadas

Po

rce

nta

je a

cu

mu

lad

o

Media 25,05

Desv.Est. 10,11

N 99

Histograma de 8Materias_AprobadasNormal

18

GRAFICAS DE LA VARIABLE MATERIAS SEMESTRE

765432

35

30

25

20

15

10

5

0

Materias_Semestre

Fre

cu

en

cia

Histograma de Materias_Semestre

765432

Materias_Semestre

Gráfica de caja de Materias_Semestre

8765432

100

80

60

40

20

0

9Materias_Semestre

Po

rce

nta

je a

cu

mu

lad

o

Media 5,081

Desv.Est. 1,291

N 99

Histograma de 9Materias_SemestreNormal

19

GRAFICAS DE LA VARIABLE MINUTOS LLEGAR A LA ESPOL

14012010080604020

25

20

15

10

5

0

Minutos_llegar

Fre

cu

en

cia

Histograma de Minutos_llegar

160140120100806040200

Minutos_llegar

Gráfica de caja de Minutos_llegar

1501209060300

100

80

60

40

20

0

8Minutos_llegar

Po

rce

nta

je a

cu

mu

lad

o

Media 49,57

Desv.Est. 24,67

N 99

Histograma de 8Minutos_llegarNormal

20

GRAFICAS DE LA VARIABLE HORAS COMPUTADOR

1815129630

40

30

20

10

0

Horas_Computador

Fre

cu

en

cia

Histograma de Horas_Computador

20151050

Horas_Computador

Gráfica de caja de Horas_Computador

1815129630

100

80

60

40

20

0

11Horas_Computador

Po

rce

nta

je a

cu

mu

lad

o

Media 3,451

Desv.Est. 2,477

N 99

Histograma de 11Horas_ComputadorNormal

21

GRAFICAS DE LA VARIABLE HORAS INTERNET

6050403020100

25

20

15

10

5

0

Horas_Internet

Fre

cu

en

cia

Histograma de Horas_Internet

6050403020100

Horas_Internet

Gráfica de caja de Horas_Internet

6050403020100-10

100

80

60

40

20

0

12Horas_Internet

Po

rce

nta

je a

cu

mu

lad

o

Media 16,57

Desv.Est. 13,29

N 98

Histograma de 12Horas_InternetNormal

22

GRAFICAS DE LA VARIABLE HORAS TELEVISION

37.530.022.515.07.50.0

18

16

14

12

10

8

6

4

2

0

Horas_Television

Fre

cu

en

cia

Histograma de Horas_Television

403020100

Horas_Television

Gráfica de caja de Horas_Television

37,530,022,515,07,50,0-7,5

100

80

60

40

20

0

13Horas_Television

Po

rce

nta

je a

cu

mu

lad

o

Media 11,96

Desv.Est. 9,598

N 100

Histograma de 13Horas_TelevisionNormal

23

2.3 Medidas de Tendencia central, dispersión, posición y sesgo

MEDIDAS DE TENDENCIA CENTRAL DE X

X=>Edades de Alumnos

302826242220

Mediana

Media

21,521,020,520,0

1er cuartil 20,000

Mediana 20,000

3er cuartil 22,000

Máximo 30,000

20,564 21,316

20,000 21,000

1,664 2,202

A -cuadrado 5,55

V alor P < 0,005

Media 20,940

Desv .Est. 1,895

V arianza 3,592

Sesgo 2,08611

Kurtosis 6,25379

N 100

Mínimo 19,000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 2Edad

Media

Mediana

0

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

24

DISPERSION DE LA VARIABLE X

Varianza

Desviación estándar

1,89477903

Coeficiente de Variación

0,090227

25

POSICION DE LA VARIABLE X

Percentil 95

=95.95

Percentil 35

=35.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

Cuartil 3

=75.75

26

OTROS CALCULOS DE LA VARIABLE X

Coefciente de asimetría

Coeficiente de Kurtosis

6,25

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

27

MEDIDAS DE TENDENCIA CENTRAL DE Y

Y=>Estatura de Alumnos

187,5180,0172,5165,0157,5

Mediana

Media

172171170169

1er cuartil 166,00

Mediana 170,00

3er cuartil 175,00

Máximo 190,00

169,22 172,16

169,00 172,00

6,49 8,59

A -cuadrado 0,52

V alor P 0,187

Media 170,69

Desv .Est. 7,39

V arianza 54,68

Sesgo -0,110671

Kurtosis 0,467159

N 100

Mínimo 152,00

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 4Estatura

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

28

DISPERSION DE LA VARIABLE Y

Varianza

Desviación estándar

7,39

Coeficiente de Variación

4,33

29

POSICION DE LA VARIABLE Y

Percentil 95

=95.95

Percentil 35

=35.35

69

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

70

Cuartil 3

=75.75

30

OTROS CALCULOS DE LA VARIABLE Y

Coefciente de asimetría

Coeficiente de Kurtosis

0,47

Rango Intercuartil

Rango

Un resultado negativo

significa que la

distribución se sesga a la

derecha.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

31

MEDIDAS DE TENDENCIA CENTRAL DE Z

Z=>Materias aprobadas

564840322416

Mediana

Media

27,025,524,022,521,0

1er cuartil 19,000

Mediana 23,000

3er cuartil 28,000

Máximo 57,000

23,035 27,067

21,000 24,000

8,869 11,752

A -cuadrado 4,95

V alor P < 0,005

Media 25,051

Desv .Est. 10,108

V arianza 102,171

Sesgo 1,53183

Kurtosis 2,11226

N 99

Mínimo 12,000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 8Materias_Aprobadas

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

32

DISPERSION DE LA VARIABLE Z

Varianza

Desviación estándar

10,11

Coeficiente de Variación

40,35

33

POSICION DE LA VARIABLE Z

Percentil 95

=95.95

Percentil 35

=35.35

1.35

Decil 9

=90.9

Decil 2

=20.2

7

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

3

Cuartil 3

=75.75

34

OTROS CALCULOS DE LA VARIABLE Z

Coefciente de asimetría

Coeficiente de Kurtosis

2,11

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

35

MEDIDAS DE TENDENCIA CENTRAL DE W

W=>Peso de alumnos

1101009080706050

Mediana

Media

72,070,569,067,566,0

1er cuartil 60,000

Mediana 69,000

3er cuartil 78,000

Máximo 113,000

67,455 72,733

66,130 72,000

11,543 15,317

A -cuadrado 0,74

V alor P 0,051

Media 70,094

Desv .Est. 13,163

V arianza 173,269

Sesgo 0,793666

Kurtosis 0,961248

N 98

Mínimo 48,630

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 5Peso

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

36

DISPERSION DE LA VARIABLE W

Varianza

Desviación estándar

13,16

Coeficiente de Variación

18,78

37

POSICION DE LA VARIABLE W

Percentil 95

=95.95

Percentil 35

=35.35

1.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

.5

Cuartil 3

=75.75

38

OTROS CALCULOS DE LA VARIABLE Z

Coefciente de asimetría

Coeficiente de Kurtosis

0,96

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

39

MEDIDAS DE TENDENCIA CENTRAL DE V

V=>Horas de Computador

1815129630

Mediana

Media

4,03,53,02,52,0

1er cuartil 2,0000

Mediana 3,0000

3er cuartil 4,0000

Máximo 18,0000

2,9572 3,9452

2,0000 4,0000

2,1735 2,8798

A -cuadrado 4,22

V alor P < 0,005

Media 3,4512

Desv .Est. 2,4770

V arianza 6,1354

Sesgo 2,5721

Kurtosis 11,5608

N 99

Mínimo 0,5000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 11Horas_Computador

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

40

DISPERSION DE LA VARIABLE V

Varianza

Desviación estándar

2,477

Coeficiente de Variación

71,77

41

POSICION DE LA VARIABLE V

Percentil 95

=95.95

Percentil 35

=35.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

3

Cuartil 3

=75.75

42

OTROS CALCULOS DE LA VARIABLE V

Coefciente de asimetría

Coeficiente de Kurtosis

11,56

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

43

MEDIDAS DE TENDENCIA CENTRAL DE U

U=>Horas de Television

37,530,022,515,07,50,0

Mediana

Media

1412108

1er cuartil 5,000

Mediana 10,000

3er cuartil 19,750

Máximo 40,000

10,056 13,864

8,000 10,000

8,427 11,150

A -cuadrado 3,30

V alor P < 0,005

Media 11,960

Desv .Est. 9,598

V arianza 92,120

Sesgo 0,959289

Kurtosis 0,140496

N 100

Mínimo 0,000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 13Horas_Television

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

44

DISPERSION DE LA VARIABLE U

Varianza

Desviación estándar

9,598

Coeficiente de Variación

80,25

45

POSICION DE LA VARIABLE U

Percentil 95

=95.95

Percentil 35

=35.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

3

Cuartil 3

=75.75

46

OTROS CALCULOS DE LA VARIABLE U

Coefciente de asimetría

Coeficiente de Kurtosis

0,14

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

47

MEDIDAS DE TENDENCIA CENTRAL DE T

T=>Materias este Semestre

765432

Mediana

Media

6,005,755,505,255,00

1er cuartil 4,0000

Mediana 5,0000

3er cuartil 6,0000

Máximo 7,0000

4,8233 5,3383

5,0000 6,0000

1,1329 1,5010

A -cuadrado 3,36

V alor P < 0,005

Media 5,0808

Desv .Est. 1,2911

V arianza 1,6669

Sesgo -0,385466

Kurtosis -0,691492

N 99

Mínimo 2,0000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 9Materias_Semestre

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

48

DISPERSION DE LA VARIABLE T

Varianza

Desviación estándar

1,291

Coeficiente de Variación

25,41

49

POSICION DE LA VARIABLE T

Percentil 95

=95.95

Percentil 35

=35.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

5

Cuartil 3

=75.75

50

OTROS CALCULOS DE LA VARIABLE T

Coefciente de asimetría

Coeficiente de Kurtosis

-0,69

Rango Intercuartil

Rango

Un resultado negativo

significa que la

distribución se sesga a la

derecha.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

51

MEDIDAS DE TENDENCIA CENTRAL DE S

S=>Horas Internet

6050403020100

Mediana

Media

1816141210

1er cuartil 6,000

Mediana 14,000

3er cuartil 21,750

Máximo 60,000

13,901 19,232

10,000 16,000

11,658 15,469

A -cuadrado 3,11

V alor P < 0,005

Media 16,566

Desv .Est. 13,294

V arianza 176,735

Sesgo 1,20845

Kurtosis 1,14876

N 98

Mínimo 1,000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 12Horas_Internet

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

52

DISPERSION DE LA VARIABLE S

Varianza

Desviación estándar

13,29

Coeficiente de Variación

80,25

53

POSICION DE LA VARIABLE S

Percentil 95

=95.95

Percentil 35

=35.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

14.5

Cuartil 3

=75.75

54

OTROS CALCULOS DE LA VARIABLE S

Coefciente de asimetría

Coeficiente de Kurtosis

1,15

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

55

MEDIDAS DE TENDENCIA CENTRAL DE R

R=>Minutos llegar a la ESPOL

14012010080604020

Mediana

Media

5652484440

1er cuartil 30,000

Mediana 45,000

3er cuartil 60,000

Máximo 150,000

44,646 54,485

40,000 45,000

21,643 28,676

A -cuadrado 3,54

V alor P < 0,005

Media 49,566

Desv .Est. 24,665

V arianza 608,371

Sesgo 1,52971

Kurtosis 3,06687

N 99

Mínimo 15,000

Prueba de normalidad de A nderson-Darling

Interv alo de confianza de 95% para la media

Interv alo de confianza de 95% para la mediana

Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%

Resumen para 8Minutos_llegar

Media

Mediana

Moda

Podemos decir que la media (aritmética) es

la cantidad total de la variable distribuida a

partes iguales entre cada observación.

56

DISPERSION DE LA VARIABLE R

Varianza

Desviación estándar

24,67

Coeficiente de Variación

49,76

57

POSICION DE LA VARIABLE R

Percentil 95

=95.95

Percentil 35

=35.35

Decil 9

=90.9

Decil 2

=20.2

Decil 7

=70.7

Cuartil 1

=25.25

Cuartil 2

=50.50

45

Cuartil 3

=75.75

58

OTROS CALCULOS DE LA VARIABLE R

Coefciente de asimetría

Coeficiente de Kurtosis

3,07

Rango Intercuartil

Rango

Un resultado positivo

significa que la

distribución se sesga a la

izquierda.

El resultado muestra que se trata de

una distribución platicúrtica, es decir,

con una reducida concentración

alrededor de los valores centrales de la

distribución.

59

3. Matriz de covarianzas y correlación

3.1 Determinación de la Matriz de Varianzas y Covarianzas Muestral S

Es una representación ordenada de las varianzas y las covarianzas entre las variables analizadas:

Matriz de Varianzas y Covarianzas Muestral S

Esta

tura Peso

Materias_

Aprobadas

Minutos

_llegar

Horas_I

nternet

Horas_Co

mputador

Horas_T

elevision

Materias_

Semestre

Eda

d

Estatura

54,6

807

61,5

789 -2,18666 2,68604 0,81364 1,32553 -6,04283 0,47702

0,05

192

Peso

61,5

789

173,

269 -9,97895

18,1331

7

14,7561

6 1,68612 4,56612 -0,03801

3,10

756

Materias_

Aprobadas

-

2,18

666

-

9,97

895

102,17089 4,99569 -

9,94346 1,77232 2,43166 0,56512

7,45

156

Minutos_ll

egar

2,68

604

18,1

3317 4,99569

608,370

65

-

57,6927

6

-8,39157 7,20851 3,94046

-

1,52

216

Horas_Inte

rnet

0,81

364

14,7

5616 -9,94346

-

57,6927

6

176,735

25 15,56333 46,36761 -1,13128

1,11

819

Horas_Co

mputador

1,32

553

1,68

612 1,77232

-

8,39157

15,5633

3 6,13544 1,8856 -0,93443

1,19

476

Horas_Tel

evision

-

6,04

283

4,56

612 2,43166 7,20851

46,3676

1 1,8856 92,1196 0,17512

-

1,78

02

Materias_S

emestre

0,47

702

-

0,03

801

0,56512 3,94046 -

1,13128 -0,93443 0,17512 1,66687

-

0,55

628

Edad

0,05

192

3,10

756 7,45156

-

1,52216 1,11819 1,19476 -1,7802 -0,55628

3,59

232

60

3.2 Determinación de la Matriz de Correlación Muestral R.

Es una representación ordenada de los coeficientes de correlación de cada variable con la otra

variable y consigo misma.

Correlación Muestral R.

Esta

tura

Pes

o

Materias_A

probadas

Minutos

_llegar

Horas_I

nternet

Horas_Co

mputador

Horas_Te

levision

Materias_

Semestre

Ed

ad

Estatura 1

0,6

27 -0,03 0,015 0,008 0,072 -0,085 0,05

0,0

04

Peso 0,62

7 1 -0,075 0,055 0,083 0,051 0,036 -0,002

0,1

23

Materias_A

probadas -

0,03

-

0,0

75 1 0,02 -0,074 0,07 0,025 0,043

0,3

87

Minutos_ll

egar 0,01

5

0,0

55 0,02 1 -0,175 -0,136 0,03 0,128

-

0,0

32

Horas_Inte

rnet

0,00

8

0,0

83 -0,074 -0,175 1 0,583 0,377 -0,067

0,0

44

Horas_Co

mputador

0,07

2

0,0

51 0,07 -0,136 0,583 1 0,079 -0,291

0,2

54

Horas_Tele

vision

-

0,08

5

0,0

36 0,025 0,03 0,377 0,079 1 0,014

-

0,0

98

Materias_S

emestre 0,05

-

0,0

02 0,043 0,128 -0,067 -0,291 0,014 1

-

0,2

26

Edad 0,00

4

0,1

23 0,387 -0,032 0,044 0,254 -0,098 -0,226 1

61

4. Estadística Inferencial

4.1 Intervalos de confianza

EDADES DE ALUMNOS

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100 ; n 30

1,895

20,94 – 1.96 20,94 + 1.96

20,564 21,316

21,421,321,221,121,020,920,820,720,620,5

Edad

Gráfica de intervalos de Edad95% IC para la media

62

ESTATURA

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100 ; n 30

7,39

– 1.96 + 1.96

169,22 172,16

172,5172,0171,5171,0170,5170,0169,5169,0

Estatura

Gráfica de intervalos de Estatura95% IC para la media

63

MATERIAS APROBADAS

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

10,108

– 1.96 + 1.96 169,22

23,035 27,067

2726252423

Materias_Aprobadas

Gráfica de intervalos de Materias_Aprobadas95% IC para la media

64

PESO

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

10,108

– 1.96 + 1.96 169,22

67,455 72,733

73727170696867

Peso

Gráfica de intervalos de Peso95% IC para la media

65

HORAS COMPUTADOR

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

3,4512

– 1.96 + 1.96

2,9572 3,9452

4,03,83,63,43,23,0

Horas_Computador

Gráfica de intervalos de Horas_Computador95% IC para la media

66

HORAS TELEVISION

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

9,598

– 1.96 + 1.96

10,056 13,864

1413121110

Horas_Television

Gráfica de intervalos de Horas_Television95% IC para la media

67

MATERIAS SEMESTRE

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

1,2911

– 1.96 + 1.96

4,8233 5,3383

5,45,35,25,15,04,94,8

Materias_Semestre

Gráfica de intervalos de Materias_Semestre95% IC para la media

68

HORAS INTERNET

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

13,294

– 1.96 + 1.96

13,901 19,232

191817161514

Horas_Internet

Gráfica de intervalos de Horas_Internet95% IC para la media

69

MINUTOS DE LLEGAR A LA ESPOL

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

= 1.96

Como el n= 100; n 30

24,665

– 1.96 + 1.96

44,646 ,485

55,052,550,047,545,0

Minutos_llegar

Gráfica de intervalos de Minutos_llegar95% IC para la media

70

Criterio para análisis del valor p

El mínimo valor de α para rechazar Ho

Valor P < 0.05 (5%) (5%) 0.05<p<0.1 (10%) Valor P >0.1 (10%)

SE RECHAZA Ho INCERTIDUMBRE SE ACEPTA Ho

En el caso que no se conozca el nivel de significancia (α), se puede aceptar o rechazar un hipótesis

planteada (Hipótesis Nula) con la ayuda del criterio del valor p.

4.2 Pruebas de hipótesis para medias.

Edades

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 22

: 22

: 22

Valor estadística de prueba

Z =

Z =

Z =

Z = -5,5936

Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor 0.05

(5%).

71

Estatura de Alumnos

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 170

: 170

: 170

Valor estadística de prueba

Z =

Z =

Z =

Z = 0,9337

=0,823815

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

Materias Aprobadas

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 25

: 25

: 25

Valor estadística de prueba

Z =

Z =

Z =

Z = 0,049

72

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

Peso de Alumnos

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 68

: 68

: 68

Valor estadística de prueba

Z =

Z =

Z =

Z = 1,5881

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

Horas de Computador

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 5

: 5

: 5

Valor estadística de prueba

Z =

Z =

Z =

Z = -6,27

73

Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor 0.

05(5%).

Horas de Televisión

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 11

: 11

: 11

Valor estadística de prueba

Z =

Z =

Z =

Z = 1,00

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

Materias Semestre

Realizar una prueba de hipótesis para la media poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 4

: 4

: 4

Valor estadística de prueba

Z =

Z =

Z =

74

Z = 8,36

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

Horas Internet

Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 16

: 16

: 16

Valor estadística de prueba

Z =

Z =

Z =

Z = 0,7221

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

Minutos llegar a la ESPOL

Realizar una prueba de hipótesis para la media poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que 46

: 46

: 46

Valor estadística de prueba

Z =

Z =

75

Z =

Z = 1,5846

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.

1(10%).

4.3 Intervalos de confianza Varianzas

EDADES DE ALUMNOS

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

.837

76

ESTATURA

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

MATERIAS APROBADAS

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

77

Intervalo de Confianza:

PESO

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

HORAS COMPUTADOR

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

78

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

HORAS TELEVISION

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

79

MATERIAS SEMESTRE

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

HORAS INTERNET

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

80

Intervalo de Confianza:

MINUTOS DE LLEGAR A LA ESPOL

Calcular un intervalo de confianza para la media poblacional (95% de confianza)

Suponiendo que:

=129,56

=74,22

Intervalo de Confianza:

81

Criterio para análisis del valor p

El mínimo valor de α para rechazar Ho

Valor P < 0.05 (5%) (5%) 0.05<p<0.1 (10%) Valor P >0.1 (10%)

SE RECHAZA Ho INCERTIDUMBRE SE ACEPTA Ho

En el caso que no se conozca el nivel de significancia (α), se puede aceptar o rechazar un hipótesis

planteada (Hipótesis Nula) con la ayuda del criterio del valor p.

4.4 Pruebas de hipótesis para Varianzas

Edades

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 4

: 4

Estadístico de Prueba:

n=100

Región de Rechazo:

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre

valores mayores 0.1 (10%).

82

Estatura de Alumnos

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 60

: 60

Estadístico de Prueba:

n=100

Región de Rechazo:

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre

valores mayores 0.1 (10%).

Materias Aprobadas

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 150

: 150

Estadístico de Prueba:

n=100

Región de Rechazo:

83

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre

valores mayores 0.1 (10%).

Peso de Alumnos

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 50

: 50

Estadístico de Prueba:

n=100

Región de Rechazo:

Aproximando

Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor a 0,05

(5%).

84

Horas de Computador

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 10

: 10

Estadístico de Prueba:

n=100

Región de Rechazo:

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1

(10%).

Horas de Televisión

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 100

: 100

Estadístico de Prueba:

n=100

Región de Rechazo:

85

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre

valores mayores 0.1 (10%).

Materias Semestre

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 20

: 20

Estadístico de Prueba:

n=100

Región de Rechazo:

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre

valores mayores 0.1 (10%).

86

Horas Internet

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 90

: 90

Estadístico de Prueba:

n=100

Región de Rechazo:

Aproximando

Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor a 0,05

(5%).

Minutos llegar a la ESPOL

Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o

valor p de la prueba)

Para realizar la prueba de hipótesis asumiremos que

: 700

: 700

Estadístico de Prueba:

n=100

Región de Rechazo:

87

Aproximando

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre

valores mayores 0.1 (10%).

4.5 Bondad de Ajuste

Criterio para análisis del valor p

El mínimo valor de α para rechazar Ho

Valor P < 0.05 (5%) (5%) 0.05<p<0.1 (10%) Valor P >0.1 (10%)

SE RECHAZA Ho INCERTIDUMBRE SE ACEPTA Ho

En el caso que no se conozca el nivel de significancia (α), se puede aceptar o rechazar un

hipótesis planteada (Hipótesis Nula) con la ayuda del criterio del valor p.

Tabla de Frecuencia de la edad. (k=3)

Clases

1 [ 19 21 ) 52 P(x<21) = 0.51 51

2 [ 21 23 ) 32 P(21<x<23 )= 0.35 35

3 [ 23 31) 16 P(x>31)= 0.14 14

:

:

P(x<21)

Z =

Z =

Z = 0.03

88

P(z<0.03) =0.51

P (21<x<23)

Z =

Z =

Z = 1.09

P(0.03 < z <1.09) =0.49 – 0.14 = 0.35

P(x>31)

P (z >1.09) = 0.14

= 0.56

Como no tenemos α, buscamos el valor p:

El 0.5<p<0.9 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)

Tabla de Frecuencia de la estatura (k=5)

Clases

1 [ 152 158.5 ) 5 P(x<158.5)= 0.05 5

2 [158.5 165 ) 12 P(158.5<x<165)= 0.17 17

3 [165 171.5 ) 37 P(165<x<171.5) = 0.32 32

4 [171.5 178 ) 28 P(171.5<x<178) = 0.30 30

5 [178 191 ) 18 P(x>178)= 0.16 16

:

:

P(x<158.5)

Z =

Z =

Z = - 1.65

P(z<- 1.65) = 0.05

89

P(158.5<x<165)

Z =

Z = =

Z = - 0.77

P(- 1.65 < z < - 0.77) = 0.17

P(165<x<171.5)

Z =

Z = =

Z = 0.11

P (- 0.77< z < 0.11) = 0.32

P (171.5<x<178)

Z =

Z = =

Z = 0.99

P(0.11< z <0.99) = 0.30

P(x>178)

P(z >0.99) = 0.16

=2.63

Como no tenemos α, buscamos el valor p:

El 0.5<p<0.9 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)

90

Tabla de Frecuencia de peso. (k=4)

Clases

1 [ 48.63 59.63 ) 21 P(x<59.63)= 0.21 21

2 [59.63 70.63) 38 P(59.63<x<70.63)= 0.31 31

3 [70.63 81.63) 23 P(70.63<x<81.63)= 0.29 29

4 [81.63 114.63) 18 P(x>81.63)= 0.19 19

:

:

P(x<59.63)

Z =

Z =

Z = - 0.79

P (z< - 0.79) = 0.21

P (59.63<x<70.63)

Z =

Z =

Z =0.04

P(- 0.79< z <0.04) = 0.31

P(70.63<x<81.63)

Z =

Z =

Z =0.88

P(0.04< z <0.88) = 0.29

P(x>81.63)

P(z > 0.88) = 0.19

=2.87

Como no tenemos α, buscamos el valor p:

El 0.5<p<0.1 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)

91

Tabla de Frecuencia de las materias aprobadas (k=4)

Clases

1 [ 12 20 ) 25 P(x<25)= 0.5 50

2 [ 20 28 ) 50 P(20<x<28)= 0.11 11

3 [ 28 36 ) 13 P(28<x<36)= 0.25 25

4 [ 36 60 ) 12 P(x>36)= 0.14 14

:

:

P(x<25)

Z =

Z =

Z = 0

P (z< 0) = 0.5

P(20<x<28)

Z =

Z =

Z = 0.29

P (0 < z <0.29) = 0.11

P(28<x<36)

Z =

Z =

Z = 1.08

P (0.29 < z < 1.08) = 0.25

P(x>36)

P(z > 1.08) = 0.14

=156.82

Como no tenemos α, buscamos el valor p:

El p<0.05 por lo tanto por el criterio del valor p dice que se rechaza Ho (Hipótesis Nul

92

Tabla de Frecuencia de horas computador. (k=3)

Clases

Frecuencia

Absoluta(f

)

1 [ 0.5 3.5 ) 59 P(x<3.5)= 0.51 51

2 [ 3.5 6.5) 33 P(3.5 <x<6.5)= 0.38 38

3 [ 6.5 18.5) 8 P(x>6.5)= 0.11 11

:

:

P(x<3.5)

Z =

Z =

Z = 0.02

P (z< 0.02) = 0.51

P (3.5 <x<6.5)

Z =

Z =

Z = 1.23

P (0.02< z < 1.23) = 0.38

P(x>6.5)

P(z > 1.23) = 0.11

=2.73

Como no tenemos α, buscamos el valor p:

El 0.5<p<0.1 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)

93

Tabla de Frecuencia de horas internet. (k=4)

Clases

Frecuencia

Absoluta(f

)

1 [ 1 11) 43 P(x<11)=0.34 34

2 [ 11 22) 33 P(11<x<22)=0,32 32

3 [ 22 33) 13 P(22<x<33)=0.23 23

4 [ 33 66 ) 11 P(x>33)=0.11 11

:

:

P(x<11)

Z =

Z =

Z = - 0.42

P (z< - 0.42) = 0.34

P (11<x<22)

Z =

Z =

Z =0.41

P (- 0.42< z < 0.41) = 0.5

P (22<x<33)

Z =

Z =

Z =1.24

P (0.41 < z < 1.24) = 0.05

P (x>33)

P(z > 1.24) = 0.11

=6.76

Como no tenemos α, buscamos el valor p:

94

El 0.1<p<0.05 por lo tanto por el criterio del valor p dice que no existe evidencia estadística para

rechazar Ho (Hipótesis Nula)

4.6 Tablas de contingencia

Esta prueba se puede usar para determinar la independencia entre dos métodos o factores

involucrados en la obtención de datos.

Se procedió a formar grupos con 7 variables, y analizar la independencia entre dos variables.

Terminología:

n: Cantidad de observaciones.

r: Cantidad de Filas.

c: Cantidad de Columnas

ri: Total de resultados en la fila i.

cj: Total de resultados en la columna j.

ni,j: Total de resultados observados en la fila i, columna j. (Datos Muéstrales ).

ei,j: Total de resultados observados en la fila i, columna j. (Frecuencia Esperada)

Obtención de la frecuencia esperada:

Estatura vs Peso

Estatura

Máximo: 187

Mínimo: 150

Intervalos

Bajo X<=165

Alto X>165

Peso

Máximo: 113

Mínimo: 48,63

Intervalos

Delgado X<=75

Pesado X>75

95

Tabla de contingencia:

Estatura

Bajo Alto Totales

Delgado 22 49 71

Peso Pesado 6 23 29

Totales 28 72 100

Frecuencia esperada :

1 2

1 19,88 51,12

2 8,12 20,88

Prueba de hipótesis.

Ho: La Estatura es independiente del Peso.

Ha: No son independientes (Negando Ho).

Estadístico de Prueba:

Región de Rechazo:

Apoyados en MINITAB:

1,083

Como no tenemos α, buscamos el valor p:

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1

(10%).

96

Edad vs Materias Aprobadas

Edad

Máximo: 30

Mínimo: 19

Intervalos

Normal X<=20

Mucha X>20

Materias Aprobadas

Máximo: 57

Mínimo: 12

Intervalos

Pocas X<=20

Muchas 21<=X<=35

Bastantes X>=36

Tabla de contingencia:

Materias Aprobadas

Pocas Muchas Bastantes Totales

Joven 17 22 8 47

Edad Adulto 18 31 4 53

Totales 35 53 12 100

Frecuencia esperada :

1 2 3

1 16,45 24,91 5,64

2 18,55 28,09 6,36

Prueba de hipótesis.

Ho: Las Materias Aprobadas es independiente de la Edad.

Ha: No son independientes (Negando Ho).

97

Estadístico de Prueba:

Región de Rechazo:

Apoyados en MINITAB:

Como no tenemos α, buscamos el valor p:

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1

(10%).

Edad vs Estatura

Edad

Máximo: 30

Mínimo: 19

Intervalos

Joven X<=20

Adulto X>20

Estatura

Máximo: 187

Mínimo: 150

Intervalos

Bajo X<=160

Media 161<=X<=170

Alto X>=171

98

Tabla de contingencia:

Estatura

Bajo Media Alta Totales

Joven 8 17 22 47

Edad Adulto 7 27 19 53

Totales 15 44 41 100

Frecuencia esperada :

1 2 3

1 7,05 20,68 19,27

2 7,95 23,32 21,73

Prueba de hipótesis.

Ho: La Estatura es independiente de la Edad.

Ha: No son independientes (Negando Ho).

Estadístico de Prueba:

Región de Rechazo:

Apoyados en MINITAB:

Como no tenemos α, buscamos el valor p:

No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1

(10%).

99

Año de Ingreso vs Materias Aprobadas

Año de Ingreso

Máximo: 1999

Mínimo: 2008

Intervalos

1Gerneración X<=2007

2Generación X>=2008

Materias Aprobadas

Máximo: 57

Mínimo: 12

Intervalos

Pocas X<=28

Bastantes X>28

Tabla de contingencia:

Ingreso Espol

1Generación 2Generación Totales

Materias Pocas 43 36 79

Aprobadas Bastantes 16 5 21

Totales 59 41 100

Frecuencia esperada :

1 2

1 46,61 32,39

2 12,39 8,61

Prueba de hipótesis.

Ho: El Ingreso a la Espol es independiente de las Materias Aprobadas.

Ha: No son independientes (Negando Ho).

Estadístico de Prueba:

100

Región de Rechazo:

Apoyados en MINITAB:

Como no tenemos α, buscamos el valor p:

Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor a 0.05

(5%).

Regresión

Análisis de regresión: Peso vs. Estatura

La ecuación de regresión es

C1 = 163 + 0,0899 C2

Predictor Coef Coef. de EE T P

Constante 163,289 4,091 39,91 0,000

C2 0,08990 0,05740 1,57 0,121

S = 7,44116 R-cuad. = 2,4% R-cuad.(ajustado) = 1,4%

Análisis de varianza

Fuente GL SC MC F P

Regresión 1 135,84 135,84 2,45 0,121

Error residual 98 5426,35 55,37

Total 99 5562,19

101

5. Conclusiones Al finalizar este proyecto puedo recordar todo lo ocurrido durante la realización de este por lo que

he llegado a algunas conclusiones:

Al finalizar este proyecto puedo recordar todo lo ocurrido durante la realización de este por

lo que he llegado a algunas conclusiones:

Las variables de redes sociales, sexo, internet en casa son variables cualitativas mientras

las variables de edad, peso, estatura, materias aprobadas, materias tomadas, horas de

computador, minutos de legar a la espol, horas de televisión, horas de internet son variables

cuantitativas.

Para saber que si dos variables son independientes entre si utilizamos el método de ji

cuadrado y nos dio las siguientes conclusiones:

Que la variable peso y estatura son independientes entre si.

Que la variable edad y materias aprobadas son independientes entre si.

Que la variable edad y estatura son independientes entre si.

Que la variable año de ingreso y materias aprobadas son dependientes entre si.

Para saber de que si son de distribución normal se hizo el procedimiento de tablas de

contingencia y la siguiente conclusión que las variables peso, edad estatura, peso son de

distribución normal.

Los intervalos de confianza son un buen estimador para las medias de una de las siguientes

variables son:

Edades

20,564 21,316

Estatura

169,22 172,16

Materias aprobadas

169,22 172,16

Peso

67,455 72,733

102

6. Recomendaciones

Es necesario realizar un estudio metódico, con tiempo acerca de las muestras para poder

presentar datos fiables.

Es necesario estimar o suponer ciertos parámetros que ayuden a un análisis de éstas para

que posean cierta “correspondencia.”

103

7. Bibliografía PROBABILIDAD Y ESTADÍSTICA: Fundamentos y Aplicaciones. Autor: Gaudencio

Zurita Herrera. ISBN: 9789978310557. ICM – ESPOL. Guayaquil – Ecuador.

www.icm.espol.edu.ec

INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA de BEAVER, ROBERT

J. y BEAVER, BARBARA M. y MENDENHALL, WILLIAM. ISBN: 9789706861955. Nº

Edición: 1ª ED. Año de edición: 2003. Plaza edición: MEXICO

Rodríguez Ojeada L. Probabilidad y Estadística Básica para Ingenieros. ICM – ESPOL.

Guayaquil – Ecuador. www.icm.espol.edu.ec

Meet Minitab 15 para Windows Enero 2007

104

Formulario a ser administrado a estudiantes

Con el fin de disponer de un conjunto de datos reales que puedan ser utilizados en diversos ejercicios, se responderá de forma anónima a las siguientes preguntas.

1. DATOS GENERALES DEL INFORMANTE

1. Género: Masculino Femenino

2. Edad (en años):

3. Mes de Nacimiento (1 a 12):

4. Estatura (en centímetros):

5. Peso (en Kg, un Kg = 2.2 libras):

6. Número de hermanos:

7. Año de ingreso a la ESPOL: (Sin incluir Pre Politécnico)

8. Número de materias aprobadas: (Sin incluir Pre Politécnico)

9. Número de materias que toma el presente

semestre:

2. PARTICULARIDADES

1. Escriba un dígito al azar de 0 a 9:

2. Lugar de residencia (de lunes a viernes) en el presente semestre:

Hogar familiar en Guayaquil Residencia estudiantil Otra solución Hogar familiar fuera de Guayaquil Apartamento con compañeros en Guayaquil

3. ¿Tiene computadora personal en casa? Sí No

4. ¿Tiene usted Internet en casa? Sí No

5. En cuales de las siguientes redes sociales posee usted una cuenta (puede marcar más de una opción): Facebook Twitter Hi5 Otras__________________ Ninguna

(Especifique)

6. A cuál de las redes sociales le dedica más tiempo y atención:

7. ¿Cómo llega usted habitualmente a la ESPOL? Vehículo propio A pie Transporte ESPOL En moto o bicicleta En el vehículo de un compañero Transporte Público

8. ¿Cuántos minutos ha empleado hoy en venir a la ESPOL?

9. ¿Cuál es su equipo de fútbol favorito? Ninguno

10. ¿Cuál fue el último libro no relacionado con sus estudios en la ESPOL, que leyó por iniciativa propia?

11. Número de horas diarias que usted pasa frente un computador:

12. Número de horas semanales que usted accede a Internet:

13. Número de horas semanales que usted emplea para ver televisión:

14. ¿Tiene usted instalado servicio de Internet en su teléfono?:

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Centro de Estudios e Investigaciones Estadísticas ICM-ESPOL

FORMULARIO DE ESTADÍSTICA PARA INGENIERÍAS

105

3. OPINIÓN

1. ¿Cuál de los siguientes problemas considera es el más importante en el Ecuador actual? (Elija sólo una)

Déficit Fiscal Pérdida de valores morales

Desigualdad social Problemas Internacionales

Drogas Seguridad ciudadana Falta de empleo Otro____________________________

(Especifique)

106

top related