r-studio, diferencia estadísticamente significativa 1
TRANSCRIPT
Pasos para el análisis de datos a través de R-Studio.
En el presente análisis muestro los pasos necesarios para evaluar si existía una
diferencia estadísticamente significativa entre las calificaciones que obtuvieron los
estudiantes de un grupo de 40 personas, el cual fue dividido en partes iguales para trabajar en dos entornos virtuales de
aprendizaje distintos (uno Moodle y el otro Google Apps).
Este estudio se realizó por 2 años consecutivos; los datos evaluados a
continuación corresponden al primer año.
Abrimos R-Studio.
Nos abrirá esta interfaz.
En la ventana superior derecha hacemos clic en la pestaña Import Dataset, y luego en
la opción Text File.
Buscamos y seleccionamos el archivo(Notas-2grupos-v1.csv).
En la imagen siguiente podremos ver en la parte superior de la ventana un cuadro de texto (Input File) el cual muestra los datos
como están originalmente en el archivo, y en la parte inferior en otro cuadro de texto
(Data Frame) vemos los datos como serán mostrados luego de ser cargados a R-Studio.
Le damos clic
en Import y nos
muestra los
siguientes datos.
Podemos ver una nueva
ventana en la parte superior izquierda que nos muestra
una tabla con los datos cargados.
Además nos podemos percatar de que en la ventana inferior izquierda
que dice Console aparece un texto en color azul que antes no estaba, este es el
llamado a los datos.
Ahora vamos a la ventana Console e ingresamos los siguientes códigos para filtrar los datos de la
tabla y crear una nueva a partir del elemento (Moodle o Google Apps).
datosMoodle <-subset(Notas.2grupos.v1, grupo=="Moodle")
Como resultado de ingresar esta línea de código nos arroja una tabla con 20 elementos filtrados
a partir del elemento Moodle.
Notas.2grupos.v1 es el nombre de la tabla original de la cual filtramos los datos y creamos
la nueva tabla llamada datosMoodle
Si utilizáramos este código para otros datos tendríamos que cambiar las siguientes partes:
datosMoodle: es el nombre de la tabla nueva que vamos a crear. Notas.2grupos.v1: es el nombre de la tabla que cargamos previamente y de donde haremos el filtrado. grupo=="Moodle": (grupo) es el nombre de la columna y (Moodle) es el elemento que filtrará.
Ahora ingresamos otra línea de código.
datosGoogleApps <- subset(Notas.2grupos.v1, grupo=="Google Apps")
Que nos dará como resultado otra tabla con 20 elementos pero con la diferencia de que estos fueron filtrados a partir del elemento Google
Apps.
De nuevo (Notas.2grupos.v1) es el nombre de la tabla original de la cual filtramos los datos y
creamos la nueva tabla llamada datosGoogleApps
Ahora vamos a hacer la representación gráfica, y para ello ingresamos el
siguiente código.
plot(Notas.2grupos.v1$grupo, Notas.2grupos.v1$nota,
xlab="Grupos", ylab="Notas", type="n")
Ahora el análisis diferencial entre grupos, y para ello usamos el siguiente código.
with(Notas.2grupos.v1, tapply(nota, list(grupo), mean))
Aquí podemos ver que la nota media de los estudiantes que utilizaron la interfaz virtual de Google Apps fue de (7.25) y del grupo
de Moodle fue de (6.25).
y ya para el final analizaremos si existe una diferencia estadísticamente significativa
entre las calificaciones.
Para lo cual ingresaremos el siguiente código.
t.test(datosMoodle$nota, datosGoogleApps$nota)
y como resultado obtenemos que P-value = 0.007427
Al llevar este valor a porcentaje nos arroja: 0.007427 * 100 = 0.7427%
Por consiguiente, como conclusión podemos decir que sí existe una diferencia
estadísticamente significativa entre las notas de los dos grupos.