analisis parametricos y no parametricos

Post on 06-Jun-2015

19.682 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

DESCRIPTION

Metodologia de la Investigacion,

TRANSCRIPT

El investigador debera:1. Recolectar datos

2. Procesar y depurar

3. Almacenarlos de forma ordenada

4. Usar la tecnologia

5. Programas computacionales

Analisis entre variables

•A es la causa de B•B es la causa de A•Tanto A como B son causadas por C•La asociación de A y B es causada por una pura coincidencia.

Analisis Parametricos

• Coeficiente de Correlación de Pearson

• Analisis de dispersion

• Prueba T

Analisis No Parametricos

• La Chi cuadrada o x²

Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos variables cuantitativas.

¿Cual es la relacion entre los embarazos en adolescentes y la desercion escolar?

Variable dependiente:

Desercion escolar

Variable independiente:

Embarazos en adolescentes

Paso # 1

USO DE REGRESION LINEAL :

X= Valores de la variable independiente

Y= Valores de la variable dependiente

N= numero de observaciones

n Ydesercion

Xembarazos

X² xy Y²

1 500 103 10,609 51,500 250,000

2 425 97 9,409 41,225 180,625

3 610 139 19,321 84,790 372,100

4 300 65 4,225 19,500 90,000

∑ 1,835 404 43,564 197,015

892,725

A=∑ X²∑Y-∑X∑XY = 31.33 n∑ X²-(∑ X)²

B=n∑ XY-∑X∑Y= 4.23 n∑ X²-( ∑X)²

Y=A + B (x)

31.33+4.23 (5)= 31.33+84.46=115.79

r = n∑xy-∑x∑y √[n∑x²-(∑x) ²)(n∑y²-(∑y) ²]

4(197015)-404(1835)= 788060-741340=46720

[4(43564)-(404)²)(4(892725)-1835²] [(174256- 163216)( 3570900-3367225) ](11040)( 203675)2248572000= √ 47419

= 0.98

El valor del índice de correlación varía en el intervalo [-1, +1]:Si r = -0.90 correlación negativa muy fuerteSi r = 0.00 no existe una correlación alguna Si r = +1 correlación positiva perfecta

Ver pag.453 Metodologia de la Investigacion

Conclusiones:

• Existe una correlacion positiva muy fuerte entre los embarazos adolescentes y la desercion escolar.

• Hipotesis comprobada: altos valores en x estan asociados con altos valores con y.

• Para la aplicacion del analisis parametrico de correlacion de Pearson se necesitan los valores historicos en estudio de una variable dependiente y otra independiente.

Regresion lineal:

La regresion lineal se determina con base en el diagrama de dispersion.Este consiste en una grafica donde se relacionan las puntuaciones de una muestra en dos variables.

NOBSERVACIONES

XEMBARAZOS

YDESERCION

1 103 500

2 97 425

3 139 610

4 65 300

PASO 1:

Ordenar los datos en una tabla de regresion lineal de relacion variable X y Y

PASO 2:

Realizar un diagrama

de dispersion que

pueda relacionar

X y Y:

Eje x (horizontal) embarazos de adolescentes

Eje

y (

vert

ical

) de

serc

ione

s

PASO 3:

Graficar cada par

de puntuaciones

en un espacio

o plano

bidimensional.

n x y

1 103 500

2 97 425

3 139 610

4 65 300

Eje x (horizontal) embarazos de adolescentes

Eje

y (

vert

ical

) de

serc

ione

s

PASO 4:

Se visualiza

graficamente

la dispersion.

n x y

1 103 500

2 97 425

3 139 610

4 65 300

Eje x (horizontal) embarazos de adolescentes

Eje

y (

vert

ical

) de

serc

ione

s

• Existe una correlacion positiva muy fuerte entre los embarazos adolescentes y la desercion escolar.

• Hipotesis comprobada: altos valores en x estan asociados con altos valores con y.

• La aplicacion del analisis parametrico de regresion lineal esta asociado con el de correlacion de Pearson.

Conclusiones:

La prueba T de Student:

Es una prueba estadistica para evaluar si dos grupos difieren entre si de manera significativa respecto a sus medias.

Se simboliza “t”.

t= x1 - x2

√s1²+ s2² n1 n2

• Donde x1 es la media del primer grupo• x2 es la media del segundo grupo• s2² representa la desviacion estandar del

segundo grupo elevado al cuadrado• Y n2 es el tamaño del segundo grupo.

El valor t se obtiene en muestras grandes mediante la formula:

N1(hombres)=128N2 (mujeres)=119

Media de hombres =15Media de mujeres =12

Desv. Estandar = 4Desv. Estandar = 3Prueba t = 6.698

Gl= (128+119)-2 =24

La variable atractivo fisico fue medida a traves de una prueba estandarizada.

Hi=“Los varones le atribuyen mayor importancia al atractivo fisico en sus relaciones heterosexuales que las mujeres”

Ho= “Los varonoes no le atribuyen mas importancia al atractivo fisico en sus relaciones heterosexuales que las mujeres”

Ejemplo:

• La hipotesis se plantea en relacion a que dos grupos difieren significativamente entre si y la hipotesis nula propone que los grupos no difieren significativamente.

• La comparacion se realiza sobre una variable, si hay diferentes variables se efectuaran varias pruebas “t”.

Conclusiones:

Analisis No Parametricos

La la chi cuadrada o x²:

Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas.

Hipótesis a probar: correlacionales.Variables consideradas: dos. La prueba chi cuadrada no considera relaciones causales. Nivel de medición de las variables: Nominal u ordinal ( o intervalos o razón reducidos a ordinales).

TABLA DE CONTINGENCIA 2x3

NORTE SUR Total

Partido derechista 180 100 280

Identificación Partido del centro 190 280 470

Partido izquierdista 170 120 290

Total 540 500 1040

= ( total o marginal de renglón) ( total o marginal de columna)

n

fe

En donde n es el número total de frecuencias observadas

para la primera celda ( zona norte y partido derechista ) la frecuencia esperada sería:

= ( 280 ) ( 540 ) = 145.4

1040

fe

CUADRO DE FRECUENCIAS ESPERADAS.

145.4 134.6 280

244.0 226.0 470

150.6 139.4 290

540 500 1040

Fórmula de la chi cuadrada

x2 = ∑ ( 0 - E )

E

∑ = Sumatoria

0 = frecuencia observada en cada celda

E= frecuencia esperada en cada celda.

Celda 0 E 0-E ( O-E)2 ( 0-E)2/ E

Zona norte partido derechista 180 145.4 34.6 1197.16 8.23

Zona norte partido centro 190 244.4 -54.4 2959.36 12.11

zona norte partido izquierdista 170 150.6 19.4 376.36 2.50

Zona sur partido derechista 100 134.6 - 34.6 1197.16 8.89

zona sur partido centro 280 226.0 54.0 2916.00 12.90

zona sur partido izquierdista 120 139.4 -19.4 379.36 2.70

x2= 47.33

Procedimiento para calcular la chi cuadrada

Interpretación: Al igual que t y f, la chi cuadrada proviene de una distribución muestral denominada distribución x2, y los resultados obtenidos en la muestra están identificados por los grados de libertad. Esto es, para saber si un valor de x2 es o no significativo, debemos calcular los grados de libertad. Estos se obtienen mediante la siguiente fórmula:

gl = ( r-1 ) ( c- 1 )

En donde r es el número de reglones del cuadro de contingencia y c el número de columnas.

En nuestro caso:

gl= ( 3-1 ) ( 2-1 ) = 2

( distribución de la chi cuadrada )eligiendo nuestro nivel de confianza ( 0.05 o 0.01 ).

Si nuestro valor calculado de x2 es igual o superior al de la tabla, decimos que las variables están relacionadas ( x 2 fue significativa ).

En el ejemplo, el valor que requerimos empatar o superar al nivel del 0.05 es 5.991. el valor de x2 calculado por nosotros es de 47.33, que es muy superior al de la tabla: x 2 resulta significativa.

EJEMPLO: HI: Los tres canales de televisión a nivel nacional difieren en la cantidad de programas pro sociales, neutrales y antisociales que difunden.

Hay relación y la variable emisión de programas pro sociales, neutrales y antisociales.

Resultados: x2 = 7.95 Gl= 4

¡Gracias por su atencion!

top related