giovanny alejandro araque duque
Post on 13-Feb-2022
7 Views
Preview:
TRANSCRIPT
EVALUACIÓN Y REDISEÑO DE LA PRUEBA INTEGRAL (π) DEL
LICEO CAMPO DAVID
GIOVANNY ALEJANDRO ARAQUE DUQUE
UNIVERSIDAD DE LOS ANDES
CENTRO DE INVESTIGACIÓN Y FORMACIÓN EN EDUCACIÓN (CIFE)
MAESTRÍA EN EDUCACIÓN
2015
EVALUACIÓN Y REDISEÑO DE LA PRUEBA INTEGRAL (π) DEL
LICEO CAMPO DAVID
GIOVANNY ALEJANDRO ARAQUE DUQUE
Directora
MARÍA FIGUEROA CAHNSPEYER
UNIVERSIDAD DE LOS ANDES
CENTRO DE INVESTIGACIÓN Y FORMACIÓN EN EDUCACIÓN (CIFE)
MAESTRÍA EN EDUCACIÓN
2015
A DIOS, mi FAMILIA
y al Liceo Campo David.
RESUMEN
La evaluación es una práctica en la educación con la cual se generan mediciones de las
habilidades, competencias o manejo de conceptos, a partir de las cuales, se realizan
cambios y ajustes a los procesos de aprendizaje y enseñanza. En el Liceo Campo David, se
creó un instrumento de evaluación para los estudiantes de Básica Secundaria y Media, con
el cual se pretende evaluar la aprehensión del conocimiento y la aplicación del mismo en
cuestionamientos que surgen de un texto de índole científico, literario, ilustrado, cotidiano,
para las asignaturas de Lenguaje, Matemáticas, Química, Física y Biología; éste se
denomina Prueba Integral “Pi” y se aplica desde el año 2011. Con el análisis de los
resultados de esta prueba, surge la idea de saber si realmente este instrumento evaluativo es
el indicado para conocer el desempeño de los estudiantes y si con esa “integralidad” con la
que se trabaja, los estudiantes han mejorado sustancialmente en la traslación de los
conceptos para desarrollar la prueba. De las 16 pruebas aplicadas en estos años, se analizó
desde lo cualitativo (validez, redacción y estructura) y cuantitativo (índice de confiabilidad,
de discriminación, de dificultad) la prueba desarrollada por los estudiantes de décimo y
undécimo en el año 2012. De ésta se obtuvo un índice de confiabilidad de 0.085, denotando
que no era idónea para medir la aplicación de los conceptos. Luego de la reestructuración,
se estimó nuevamente el índice de confiabilidad, obteniendo un 0.675, determinando así
que ya era aceptable para su fin.
Palabras clave: confiabilidad, validez, Prueba Integral, Liceo Campo David.
ABSTRACT
Evaluation is a practice in education with the measurements which are generated from the
abilities, skills or concepts from which changes are made and adjustments to the processes
of learning and teaching. At Liceo Campo David, we created an assessment instrument for
students of basic and secondary levels, with which it is intended to evaluate the arrest of the
knowledge and application of the same in questions that arise from a text of nature
scientific, literary, illustrated, daily, for the subjects of Language, Mathematics, Chemistry,
Physics and Biology; this is called Prueba Integral "Pi" and applies since the year 2011.
With the analysis of the results of this test, there arises the idea of knowing if this really is
the evaluative instrument indicated to ascertain the performance of the students and
whether the "completeness" you're working with, the students have improved substantially
in the translation of the concepts to develop the test. Of the 16 tests applied in these years,
are analyzed from the qualitative (validity, wording and structure) and quantitative
(reliability index, discrimination, difficulty) the test developed by the students of tenth and
eleventh in the year 2012. This was obtained a reliability index of 0.085, denoting that it
was not suitable for measuring the implementation of the concepts. After the restructuring,
it was felt again the reliability index, obtaining a 0.675, thus determining that it was
acceptable for its intended purpose.
Keywords: reliability index, validity, Prueba Integral, Liceo Campo David.
1
INTRODUCCIÓN
Se considera que la evaluación siempre ha estado en nuestro diario vivir; se evalúa
para obtener un crédito, para ingresar a una empresa pública o privada, para el diagnóstico
médico de alguna enfermedad, se evalúan las actitudes de las parejas para tomar decisiones,
se considera el voto por algún candidato de acuerdo a la valoración que se le da, y todas las
actividades se etiquetan teniendo en cuenta las ganancias, derrotas, lo que se recibe o lo que
da, es decir, la evaluación o valoración. Ahora, se especula que en el sitio donde más se
escucha y se es evaluado es en la escuela, lugar en el cual constantemente se evalúa el
conocimiento y/o el proceso de enseñanza-aprendizaje, además de las reacciones y
actitudes frente a alguna situación presentada, teniendo en cuenta, que de estas
evaluaciones depende el saber sobre el desempeño escolar, evidenciando las fortalezas y
debilidades que se pueden presentar en el ejercicio del aprendizaje, y porque no de la
enseñanza.
Con el transcurrir de los años, se tiene mayor concepción y entendimiento sobre el
valor que tiene el evaluar la calidad de la educación para iniciar y ajustar en el proceso
cambios y mejoras en el mismo (Iaies, 2003). Hay que tener en cuenta que se entiende la
calidad educativa como la tendencia, trayectoria o proceso de construcción continuo de
objetivos educativos no sólo referidos a los logros de los educandos, sino también a
cuestiones curriculares y organizativas, y el camino que se debe recorrer para lograrlos, y
no un mero resultado (Cano, 1998). La evaluación de la calidad educativa parte desde el
juicio de valor sobre cómo se desarrolla y qué resultados genera el conjunto del sistema
educativo y sus componentes (estructura, organización, financiamiento, el currículo y su
2
desarrollo, el desempeño de los docentes, el aprendizaje de los estudiantes y la generación
de oportunidades) (Murillo & Román, 2010).
Teniendo en cuenta lo anterior y el porqué del evaluar, surge el interrogante ¿por
qué algunas personas o instituciones cuestionan el funcionamiento o la validez de alguna
evaluación? Existirían varios motivos, pero el principal es por los resultados que se
obtienen, ya que con ellos se demuestra realmente si hay o no calidad educativa (Iaies,
Bonilla, Brunner, Halpern, Granovsky, Tiana, Martínez, Navarro, Tenti, 2003). Así
también, se cree que la mayoría de las personas no se interesan por cuestionarse sobre los
instrumentos de evaluación, ya que creen que porque los hizo o revisó alguien con alguna
autoridad educativa, deben estar “bien hechos”, además, porque los resultados obtenidos
pocas veces los afectan directamente (Iaies et al., 2003). Vale aclarar, las evaluaciones en
muchos casos están diseñadas u orientadas a dar una simple medición y es por esto que no
hay efecto alguno en el quehacer de las personas, así como lo expresa Ruiz-Córdoba
(2009), se evalúa siempre para tomar decisiones; no basta con recoger información sobre
los resultados del proceso educativo y emitir únicamente un tipo de calificación, si no se
toma alguna decisión, no existe una auténtica evaluación.
En la educación escolar aparecen constantemente distintas formas de evaluar
(quices, concursos, evaluación conceptual, evaluación por competencias, entre otros), los
cuales sirven para medir el proceso del aprendizaje o de la enseñanza propios de la escuela,
además, de permitirle a los estudiantes tener un registro del avance en el aprendizaje. Un
ejemplo de las diversas formas de evaluar se da en el Liceo Campo David, allí se
implementa desde hace cuatro años, un instrumento de evaluación que le permite a los
3
estudiantes de secundaria y media, trasladar el concepto dado en las aulas a una situación
problema extraída de un texto sencillo y así, lograr la evaluación de la capacidad de
aprendizaje y apropiación del concepto que tienen los estudiantes. Las asignaturas que se
evaluaban eran inicialmente Química, Física y Biología, las cuales hacen parte del área de
Ciencias Naturales, y permitía una mayor relación de los conceptos, y para el año 2012, se
incluyeron Lenguaje y Matemáticas, ya que estas dos son la base intelectual para
desarrollar y analizar los problemas científicos y cotidianos. La Prueba Integral (como es
llamado este instrumento) es utilizada en el Liceo Campo David para que los estudiantes se
acostumbren a realizar pruebas de tipo “integral” o multidisciplinar, como lo son algunas
pruebas de universidades nacionales o extranjeras para la admisión u obtención de una
beca.
Luego de obtener resultados por los cuatro años de aplicación (16 pruebas
desarrolladas; cuatro anuales) y analizarlos, surge la idea de saber si realmente este
instrumento evaluativo es el indicado para conocer el desempeño de los estudiantes y si con
esa “integralidad” con la que se trabaja, los estudiantes han mejorado sustancialmente en la
traslación de los conceptos para desarrollar la prueba. Junto con esto, nace la necesidad de
explicarle a los docentes, que si quiere evaluar de forma integral es porque se está
enseñando igualmente, porque no hay razón alguna de evaluar algo que no se ha enseñado
idóneamente, los docentes deben evaluar lo que realmente enseñan; el éxito del aprendizaje
está basado en los conocimientos que tiene el profesor, la metodología que usa para que le
comprendan, la cohesión que hay en su programa de clase, la previa planeación, la
aplicabilidad del conocimiento y una evaluación orientada a ciertos objetivos (Shulman,
1986).
4
Por esto, se da la evaluación formal a este instrumento llamado “Prueba Integral”
para poder determinar el camino correcto de enseñanza, aprendizaje y evaluación, junto con
la validez de la prueba, para que a través de una reforma a la misma, se pueda evaluar lo
que se pretende evaluar y que los estudiantes tengan la capacidad de analizar y comprender
hechos cotidianos a partir de los simples conceptos básicos que en la escuela aprenden.
Para esta investigación, se plantearon las siguientes preguntas: ¿Qué tan válida y confiable
es la Prueba Integral aplicada en el Liceo Campo David? ¿Cómo con una “Prueba Integral”
se pueden evaluar los conocimientos adquiridos por los estudiantes de forma tradicional?
5
OBJETIVOS
General
Evaluar formalmente la “Prueba Integral” para determinar el camino correcto de enseñanza,
aprendizaje y evaluación.
Específicos
• Validar la prueba a través de métodos cualitativos, con pares académicos y
replicación de la misma.
• Estimar índices cuantitativos para determinar la idoneidad de la prueba y las
preguntas.
• Rediseñar o reestructurar la prueba para que tenga mayor validez y confiabilidad.
6
MARCO TEÓRICO
¿Qué es evaluación?
Para muchas personas evaluar es lo mismo que medir o calificar, dar un valor
cualitativo o cuantitativo al finalizar u obtener un producto con el que se recoge
información para determinar el éxito del producto y en algunos ámbitos de la educación, es
una concepción estática que valora el aprendizaje de los estudiantes más no el proceso de
los mismos. Sin embargo, se puede considerar la evaluación como un proceso básico de
valoración en el que se obtiene información sobre las necesidades y los logros del alumno,
para formarse un juicio de calificación razonada que posibilite una posterior toma de
decisiones en la actividad educativa (Reátegui, Arakaki & Flores, 2001). Es por esto, que a
medida que en la educación se ha ido comprendiendo el objetivo de evaluar, se han
modificado los instrumentos de evaluación para incluir el proceso y que no se quede solo
en la verificación de los resultados.
Para el Ministerio de Educación Nacional (2006), el concepto de evaluación se
entiende como:
“La evaluación en la educación debe generar una huella en el quehacer académico de los estudiantes y de los docentes, ya que la evaluación tiene como propósito determinar en qué medida se están cumpliendo las metas de calidad que se fijan en los estándares, asociadas a los aprendizajes que se espera logren los estudiantes a su paso por la escuela. Por tanto, la evaluación brinda retroalimentación a las instituciones educativas, detectando fortalezas y debilidades, y valorando el quehacer de los procesos educativos sobre el desarrollo de competencias básicas por parte de los estudiantes”.
7
Según Álvarez (2001), debe entenderse que evaluar con intención formativa no es
igual a medir ni a calificar, ni siquiera a corregir; tampoco es clasificar ni es examinar ni
aplicar tests. La evaluación al ser formativa implica que haya un aprendizaje, una
corrección de los errores, y para ello es necesaria la retroalimentación de la evaluación.
Las evaluaciones deben ser retroalimentadas para que no se queden en un valor
numérico y se consolide el aprendizaje de los estudiantes; asimismo, esa retroalimentación
no solo es ganancia para el que aprende sino también, permite una autoevaluación del
docente, ya que puede evaluar su práctica de enseñanza y mejorarla constantemente.
Tipos de evaluación
Según Ruiz-Córdoba (2009) y Leyva (2010), existen varios tipos de evaluación, los
cuales se clasifican de acuerdo a diferentes criterios:
Finalidad y función, donde la evaluación puede ser formativa (como parte de los
procesos para mejorar o ajustar las estrategias y conseguir objetivos propuestos) o sumativa
(suele aplicarse como clasificación o valoración final de un proceso).
Extensión, evaluación global (comprende todos los componentes de un programa
educativo) o evaluación parcial (evalúa componentes determinados de un programa
educativo).
Agentes evaluadores, evaluación interna (los actores del programa educativo
participan en la evaluación del mismo), esta evaluación tiene varias alternativas,
8
autoevaluación (los evaluadores evalúan su desempeño), heteroevaluación (los evaluadores
evalúan a distintos agentes del programa educativo) y coevaluación (varios agentes del
programa educativo se evalúan mutuamente).
La evaluación también se puede clasificar de acuerdo a los tipos de preguntas que se
construyen (Reátegui, Arakaki & Flores, 2001):
Selección múltiple: consiste en un enunciado o frase y un conjunto de alternativas
(distractores) donde se elige una como la respuesta correcta.
Opción verdadero/falso: está constituida por una afirmación donde se determina si
es correcta o no.
Correspondencia: son preguntas confeccionadas con dos listas paralelas, una con
palabras o frases de estímulo y la otra con un listado de respuestas, de las cuales se marca la
correspondencia entre las listas según sea el caso.
De respuesta corta: en estos casos se requiere de una respuesta con una o dos frases
para la pregunta planteada.
Ensayo: la respuesta a la situación planteada debe ser amplia y argumentada. Se
evalúa la capacidad de organización, integración y ponderación de los conocimientos.
Caso problema: se describe una situación específica, se proporcionan algunos datos
pertinentes y se solicita la solución de la misma.
Características de las pruebas
Los factores que permiten evaluar una prueba son:
9
Validez de la pregunta
La validez de una pregunta en una prueba nos permite determinar si la pregunta
mide lo que la prueba se propone medir. En este sentido la correlación pregunta-prueba es
el indicador que nos mide el grado de validez de la pregunta. Es un índice de validez
interna pues la correlación se calcula con el puntaje total de la prueba, a falta del verdadero
criterio o constructo (Bazán, 2000).
Dificultad de la pregunta
La dificultad de las preguntas se mide con base al porcentaje de respuestas
correctas. El indicador varía entre 0 y 1. Una pregunta con una dificultad de ≤0,25 es más
difícil que una pregunta con una dificultad de ≥0,75, considerándose la primera de nivel de
dificultad alto, la segunda de nivel bajo, y entre ellas, de 0,26 a 0,74 nivel medio. El índice
de dificultad nos indica el grado de dificultad de cada pregunta en las áreas seleccionadas.
Si una pregunta tiene un índice de dificultad cercana a 0 ó 1, la pregunta generalmente
debería ser alterada o descartada por no estar dando información acerca de las diferencias
entre las habilidades de los examinados (Bazán, 2000).
Discriminación de la pregunta
La discriminación de una pregunta se mide por el grado en que la pregunta ayuda a
ampliar las diferencias estimadas entre los que obtuvieron un puntaje total de la prueba
relativamente alto de los que obtuvieron un puntaje relativamente bajo. El índice de este
indicador, varía entre –1 y 1. Valores positivos indican que la pregunta discrimina a favor
10
del grupo superior, negativo indica que la pregunta es discriminadora que favorece al grupo
inferior (Bazán, 2000). Dado el índice de discriminación, se puede determinar la
reestructuración o aceptación de algún distractor o de toda la pregunta.
Confiabilidad de la prueba
La confiabilidad indica la consistencia de la medición o de los resultados de una
prueba, es decir, estima el grado de precisión con el que se están midiendo las preguntas o
variables. La confiabilidad se puede hallar de varias formas: correlacionando dos formas
paralelas de la prueba, correlacionando dos mitades aleatorias de la prueba y la correlación
entre dos aplicaciones de la misma prueba a una muestra de personas en momentos
diferentes. El índice de confiabilidad oscila en un rango de 0 a 1, 0 (Bazán, 2000).
Gracias a estas características, las pruebas permiten obtener la información
suficiente para desarrollar una evaluación idónea, la cual permitirá generar los cambios y
ajustes necesarios al proceso educativo para obtener mayor aprendizaje por parte de los
educandos y docentes y mejores métodos de enseñanza, para con esto, conseguir los
resultados ante otras pruebas.
“La Prueba Integral”
La Prueba Integral, es un instrumento de evaluación multidisciplinar que se usa en
el Liceo Campo David, como una forma de lograr la contextualización de los conceptos en
situaciones o textos cotidianos, logrando con esto una integración o fusión de los saberes de
las Ciencias Naturales, el Lenguaje y las Matemáticas. Está diseñada a partir de textos de
11
donde surgen preguntas de selección múltiple sobre temas vistos durante el bachillerato, ya
que este tipo de preguntas permite recoger con mayor precisión datos de una población de
varios estudiantes y varios procesos, así como distintas áreas de conocimiento. Este tipo de
evaluación es útil para medir destrezas, conceptos, competencias; elimina la ambigüedad de
la respuesta (siempre y cuando esté bien diseñada la pregunta); la aplicación y calificación
necesita menos tiempo que las preguntas de desarrollo. Sin embargo, no es posible evaluar
aspectos de producción; presenta inconvenientes en el proceso de construcción de las
preguntas y de los distractores (Avalos, Chávez, Henríquez, Hernández, Melara, Pineda,
2012).
Con las pruebas de respuesta de selección múltiple, los resultados pueden llegar a
ser confiables y certeros, ya que permite una fácil y precisa evaluación a cada una de las
preguntas y distractores. El índice de dificultad o facilidad de una pregunta, como su
nombre lo indica, intenta dar una idea de lo fácil o difícil que es y se expresa por el
porcentaje de alumnos que la contestan bien; el índice de discriminación determina en qué
medida una pregunta es lo bastante selectiva para distinguir un grupo de mayor desempeño
en la prueba de uno de menor. Cuando se realiza una prueba a una persona o un grupo de
ellas, en momentos diferentes, esta puede presentar resultados o puntajes diferentes, ya que
el puntaje obtenido depende de un conjunto de condiciones internas (propias del
examinado) y externas (el medio) (Soler, 2008). Es por esto, que se realizan pruebas
estadísticas, como lo son índices de correspondencia entre las preguntas o índice de
confiabilidad de la prueba, donde los puntajes observados no serán muy diferentes a los
esperados, es decir, si la misma prueba se aplica a grupos diferentes o en tiempos distintos,
tendrá resultados similares.
12
La Prueba Integral se desarrolla desde hace cuatro años dada la necesidad de
familiarizar a los estudiantes con este tipo de instrumentos. Pero, solo se limita a obtener
datos a partir de los resultados, notas o valoraciones que simplemente cuantifican el
proceso del estudiante y no otorgan la información suficiente para saber qué tan apropiadas
son estas pruebas; aunque siempre hay retroalimentación de la misma, con las cuales se
determina qué tan aprehendidos están ciertos conceptos en los diferentes niveles. Sin
embargo, dado que es un instrumento “nuevo” en el Liceo Campo David y que no ha sido
evaluado, como lo han sido otros, puede tener inconsistencias y errores de los docentes al
momento de formular las preguntas, tales como indagar por un concepto que no se
desarrolla en el texto, o simplemente tomar palabras clave o sueltas y preguntar por ellas,
dejando a un lado el análisis y comprensión del texto.
Como Miller (1977) expresaba, “modificar un programa o unas técnicas de
enseñanza sin cambiar el sistema de evaluación tiene todas las probabilidades de no
conducir a nada. Cambiar el sistema de evaluación sin modificar el programa de enseñanza
ha tenido una mayor repercusión sobre la naturaleza y la calidad del aprendizaje, que si se
hubiese modificado el programa sin tocar los exámenes”. Por esto, gracias a la evaluación
de las pruebas, la modificación puede llegar a ser más eficiente obteniendo resultados
consistentes que permitan dar información para mejorar los procesos en el aprendizaje de
los estudiantes. Dadas estas razones, se decidió evaluar este instrumento de evaluación a
partir de los resultados obtenidos en las pruebas y los constructos de cada asignatura
(construidos con los docentes titulares), logrando con esto una mejora a la prueba y por
ende a las prácticas de enseñanza en el Liceo Campo David, además de convertirlo en un
13
instrumento de evaluación que tenga un gran impacto en el proceso académico de los
liceístas, ya que es necesario que comprendan que el conocimiento no es algo fragmentable
y que en su diario vivir deberán fusionar varios conceptos aprendidos y aprehendidos en su
vida escolar.
Ahora bien, a pesar que este instrumento de evaluación fue creado y pertenece al
Liceo Campo David, a nivel internacional existen pruebas con aspectos evaluativos
similares, como lo son TIMSS, PISA, PERCE, SERCE, TERCE, donde se evalúan las
competencias adquiridas en Ciencias, Matemáticas y Lenguaje, y son los referentes
internacionales para dar razón del proceso, habilidades y aprendizajes de los estudiantes
colombianos. Es por esto, que las evaluaciones internacionales son un buen ejemplo para
desarrollar pruebas donde se mida el conocimiento a partir de la aplicación y no solo del
concepto memorizado.
Colombia en las Evaluaciones Internacionales
Desde 1995, Colombia ha participado en varias evaluaciones internacionales
(TIMSS, PISA, PERCE, SERCE, TERCE) con la intención de ser comparada con otros
países e identificar las fortalezas y debilidades relativas de nuestros estudiantes y tomar
decisiones en torno al mejoramiento de la calidad y la equidad de la educación. Estas
pruebas internacionales tienen el objetivo de evaluar los conocimientos adquiridos y las
competencias esenciales que les permite a los estudiantes afrontar retos de la vida adulta.
14
Las áreas del conocimiento que las pruebas internacionales, en las que Colombia se
ha medido, evalúan son: Matemáticas, Lenguaje y Ciencias Naturales, donde a partir de
preguntas en contexto se mide la aplicación de los conceptos escolares, teniendo en cuenta
el grado y los lineamientos curriculares de cada país.
A continuación se da una breve descripción de las evaluaciones internacionales:
TIMSS (Estudio Internacional de Tendencias en Matemáticas y Ciencias). El propósito de
este estudio es medir las tendencias en el rendimiento de los estudiantes de 4° y 8° en
Matemáticas y Ciencias. Está basada en el currículo como eje central de oportunidades
educativas.
PISA (Programa Internacional de Evaluación de Estudiantes, en inglés). El objetivo de
esta evaluación es obtener información sobre las competencias en Lectura, Matemáticas y
Ciencias que poseen los estudiantes de 15 años y que les permiten participar en la vida real.
PERCE, SERCE, TERCE (Primer, Segundo y Tercer Estudio Comparativo Regional).
Este estudio tiene como fin evaluar los aprendizajes en Ciencias, Matemáticas, Lectura y
Escritura que han logrado los estudiantes latinoamericanos. Parte de un análisis del diseño
curricular de los Grados 3°, 4°, 6°.
Para llevar a cabo estas evaluaciones en Colombia, y de acuerdo a lo señalado por la
Oficina Regional de Educación de la UNESCO para América Latina y el Caribe en el
15
informe del Tercer Estudio Regional, Comparativo y Explicativo (2013), los estándares
básicos que se tuvieron en cuenta para estas tres áreas son:
Lengua Castellana: según los Estándares Básicos de Competencias (MEN, 2006),
hoy en Colombia la pedagogía de la Lengua Castellana centra su atención e interés en el
desarrollo de la competencia comunicativa de los estudiantes, en el sentido de que estén en
condiciones de identificar el contexto de comunicación en el que se encuentran y, en
consecuencia, saber cuándo hablar, sobre qué, de qué manera hacerlo, cómo reconocer las
intenciones que subyacen a todo discurso, cómo hacer evidentes los aspectos conflictivos
de la comunicación; en fin, cómo actuar sobre el mundo e interactuar con los demás a partir
de la lengua y, desde luego, del lenguaje (MEN, 2006).
Matemáticas: los estándares están relacionados con los ambientes que rodean al
estudiante y que les dan sentido a las Matemáticas que aprende. Los tipos de contexto que
se consideran pueden ser de la vida cotidiana, de otras ciencias y de las Matemáticas
mismas. El documento Lineamientos Curriculares expresa que “Las Matemáticas, lo mismo
que otras áreas del conocimiento, están presentes en el proceso educativo para contribuir al
desarrollo integral de los estudiantes” (MEN, 2006).
Ciencias Naturales: de acuerdo con los Estándares Básicos de Competencias en
Ciencias Naturales, el enfoque disciplinar en ciencias para todos los ciclos de la educación
básica y media responde a la formación en tres grandes aspectos: el conocimiento de los
procedimientos propios del trabajo científico, la enseñanza de los conceptos propios de la
ciencia y el desarrollo de compromisos personales y sociales. Las pruebas de Ciencias
Naturales buscan establecer y diferenciar las competencias de los estudiantes para poner en
16
juego sus conocimientos básicos de esta área en la comprensión y resolución de problemas.
Las pruebas, además, evalúan la comprensión que los estudiantes tienen sobre las
particularidades y los alcances del conocimiento científico, y la capacidad que poseen para
diferenciar este conocimiento de otros saberes (MEN, 2006).
Comparación de la prueba Pi con las pruebas internacionales
Las pruebas internacionales como PISA y las desarrolladas por el Laboratorio
Latinoamericano de Evaluación de la Calidad de la Educación (LLECE), PERCE, SERCE
y TERCE, plantean las preguntas a partir de un contexto único por una, dos o tres
preguntas, ya sean de tipo abierto o de selección múltiple, haciendo que los conceptos sean
evaluados de forma individual, es decir, las áreas evaluadas, Lenguaje, Matemáticas y
Ciencias, tienen situaciones problema muy diferentes para cada una de las áreas.
Ejemplos de Preguntas de la Prueba PISA 2012
MATEMÁTICAS
el grupo Los Metalgaites en abril?
PREGUNTA 1
A. 250 B. 500 C. 1000 D. 1270
s CD que el grupo Caballos Desbocaos?
n mes B. En marzo C. En abril D. En mayo
PREGUNTA 2.
17
LENGUAJE
s.
s probable que encontraras esa clase de libro para tomar prestado.
PREGUNTA 13.
n situadas las Novedades? PREGUNTA 14.
n. n.
C. Cerca de la entrada. n.
CIENCIAS NATURALES
18
PREGUNTA 24.
s ha absorbido gases como geno.
geno que hay en el aire?
rmol en vinagre, s
s del experimento.
a siguiente, la astilla se extrae y se seca.
rmol seca?
PREGUNTA 25. A. Menos de 2,0 gramos B. Exactamente, 2,0 gramos C. Entre 2,0 y 2,4 gramos D. s de 2,4 gramos
Ejemplos de Preguntas de la Prueba SERCE
19
En el caso de la Prueba Integral “Pi”, las preguntas surgen y están planteadas a
partir de un texto, desde el cual los docentes construyen las preguntas de las áreas
evaluadas, Lenguaje, Matemáticas y Ciencias Naturales (Química, Física y Biología), sin
adicionar información adicional o con un contexto diferente. De esta forma, la comprensión
lectora y la aplicación de los conceptos están relacionados en una única temática,
generando así una integralidad de los conocimientos adquiridos en estas áreas para la
solución de una situación problema.
Ejemplos de Preguntas de la Prueba Integral “Pi”
LOS ACUEDUCTOS ROMANOS
La Roma antigua consumía unos 160 millones de litros de agua cada día, sobre todo en fuentes, estanques, baños y letrinas públicas. Una parte de ese caudal iba directamente a las casas de los ricos, que vivían en villas o en manzanas de casonas de un piso. Pero la gente que habitaba en pisos altos tenía que recoger agua de las fuentes y de los estanques, o contratar los servicios de aguadores profesionales. Canalización del agua: El agua era llevada a Roma por una red de 420 Km. de canales y tuberías desde manantiales, lagos y ríos situados en las montañas de los alrededores; el suministro era continuo, pues no había manera de regularlo. Unas cuantas villas tenían grifos formados por un tubo inserto en el conducto de abastecimiento (llamado quinaria, de unos 2 cm. de diámetro); aquél tenía un orificio por donde fluía el líquido y podía cerrarse o abrirse haciéndolo girar. El agua fluía por gravedad a lo largo de la red. Los canales (acueductos) eran de ladrillo o de piedra con un revestimiento interior de cemento impermeable, y en promedio medían 90 cm. de ancho y 1.8 m de profundidad; algunos eran subterráneos y tenían respiraderos cada 73 m aproximadamente. Suministro por tuberías de plomo: En algunas partes del Imperio el agua era llevada a las ciudades por tuberías de cerámica o de plomo y no por acueductos. El Imperio Romano recubría las cañerías y las bañeras con plomo o con cobre, también empleaba plomo en el recubrimiento en tejados de viviendas. Hervían a fuego lento y fermentaban el vino en recipientes recubiertas de plomo, ya que los de cobre daban mal sabor a la bebida, al hervir a fuego lento se formaba "azúcar de plomo" (en realidad era acetato de plomo). Esto causó muchos casos de saturnismo (un envenenamiento por plomo llamado así porque el plomo era llamado Saturno), pero confundían el envenenamiento por plomo con envenenamiento etílico (debido al consumo de alcohol) por lo que siguieron utilizando el plomo. Muchos alimentos preparados también estaban contaminados por plomo, lo que producía la gota saturnina. Se piensa que la caída del Imperio Romano tiene que ver con el consumo de alimentos y bebidas contaminadas con plomo… (Ver Anexo 1)
20
Luego de la exposición del texto a referenciar, se realizan preguntas de selección múltiple
de las asignaturas Lenguaje, Matemáticas, Química, Física y Biología. Dichas preguntas
están basadas en lo plasmado en el texto.
MATEMÁTICAS Los Romanos se aseguraron que los canales descendieran 5 cm cada 100 metros y un canal specus se extendía unos 50 km. Si esta trayectoria se realiza en línea recta, la altura que ha descendido el agua en este canal es A. 250 km B. 250 m C. 25 cm D. 25 m
BIOLOGÍA
La fermentación se considera un tipo de respiración porque A. produce la energía celular de forma inmediata. B. usa el oxígeno para producir energía celular
(ATP). C. a partir de ella se obtiene energía en forma de
ADP. D. contribuye a la formación de NAD+ para
producir ATP.
LENGUAJE
El eje central del texto anterior logra una síntesis temática con las invenciones culturales griegas, siendo un ejemplo de ello su relación con A. la catarsis. B. la máscara. C. el ágora. D. el coro.
QUÍMICA
Durante la época de la Antigua Roma, se confundió el envenenamiento con plomo con el envenenamiento con alcohol. Para que una persona sufra de intoxicación por alcohol etílico (C2H5OH), debe tener una concentración de 0,55 g por litro de sangre. Si se estima que la densidad de la sangre es de aproximadamente 1,088 g/mL, la concentración molar de la sangre es A. 0,1 B. 0,01 C. 0.001 D. 0.0005
FÍSICA
Si la densidad del agua es 1.0x103 kg/m3
, la cantidad de masa que contiene un metro de canal promedio es A. 1000 kg B. 1620 kg C. 1000 g D. 16.2 kg
21
METODOLOGÍA
En ocasiones se evalúa el proceso de creación de las pruebas y si existe alguna
retroalimentación, es para los estudiantes sobre las fallas obtenidas, pero no para los
evaluadores o constructores, ya que se cree que como son los “conocedores” o docentes, no
cometen errores o lo hacen en mínimas proporciones, sin tener en cuenta que las fallas
obtenidas por los estudiantes pueden ser por errores en el diseño de la pregunta. Es por esto,
que a partir de la evaluación de los instrumentos de evaluación, de acuerdo a la forma y a
los resultados obtenidos, se pueden detectar aquellos errores que permitan modificar y
ajustar la prueba para mejorar el proceso de aprendizaje y enseñanza. De acuerdo a lo
anterior, se llevó a cabo la evaluación de la Prueba Integral que se realiza en el Liceo
Campo David en los niveles de Básica Secundaria y de Media, a través del método mixto,
(cuantitativo y cualitativo) para reestructurarla y estimar su validez y confiabilidad,
además de valorar la idoneidad de este instrumento para evaluar los conocimientos de los
estudiantes liceístas.
Población
El Liceo Campo David desarrolla las actividades académicas en la Localidad Sexta
– Tunjuelito, al sur de Bogotá, con una población de estrato socioeconómico dos y tres,
desde el año 1986. El Liceo Campo David es una institución privada de tipo formal y de
carácter mixto, perteneciente al calendario A. Cuenta con los niveles de Preescolar, Básica
22
y Media. Actualmente, la comunidad educativa está conformada por 690 familias, 830
estudiantes, 36 docentes, 6 Administrativos, 3 Coordinadores, 4 Secretarias, 18 personas de
Servicios Generales, 4 personas de apoyo y 216 exalumnos titulados de 14 promociones de
bachilleres.
Prueba Pi (Prueba Integral)
El instrumento de evaluación que se evaluó y reestructuró hace parte del Sistema
Institucional de Evaluación en el Liceo Campo David. Esta Prueba Integral “Pi” se lleva a
cabo en los niveles de Básica Secundaria y Media, en el que a partir de un texto cotidiano o
científico, se evalúan temas sobre Lenguaje, Matemáticas, Física, Química y Biología; la
prueba tiene quince preguntas de selección múltiple, tres preguntas por cada asignatura. Se
realizan tres pruebas diferentes de acuerdo al nivel de los grados, una para 6° y 7°, otra para
8° y 9°, y para 10° y 11° una distinta.
De las pruebas en los años 2011 y 2012, se tomó la aplicada para los grados Décimo
(29 estudiantes) y Undécimo (19 estudiantes) en el mes de octubre del 2012, debido a que
son los grados donde se culmina la vida escolar, la apropiación de los conocimientos es
amplia, la habilidad frente a las pruebas de selección múltiple es mayor y la certeza de las
respuestas que tienen ellos disminuye el sesgo de error procedimental en los cálculos,
comprensión lectora y desarrollo global de la prueba. El estudio se realizó a partir de los
resultados arrojados por el programa de análisis de test llamado ITEMAN (Assessment
23
Systems Corporation, Versión 3,6 para Windows), con el que se obtuvieron datos de grados
de dificultad de las preguntas, índice de discriminación de las preguntas y de los
distractores, distribución de las respuestas, tanto de la correcta como de los distractores.
Luego de revisar los datos arrojados por ITEMAN, se analizó la prueba, para realizar las
debidas modificaciones y presentarla posteriormente (Prueba Integral “Pi” del año 2012 del
mes de octubre) como piloto a los estudiantes de grado Décimo y Undécimo de años
siguientes.
En el componente cualitativo, el análisis de las pruebas se basó en una revisión de
forma, teniendo en cuenta los distractores y la redacción, coherencia con el texto propuesto
y que la pregunta esté basada en el mismo, y si al resolverla, es necesaria la lectura y
comprensión del texto, llamado validez. Este análisis fue posible y efectivo, gracias a los
porcentajes de distribución de las opciones tanto para la respuesta como para los
distractores. En el componente cuantitativo, se evaluó la validez de las preguntas, dificultad
y discriminación de las mismas, además de la confiabilidad de la prueba, a partir de los
índices obtenidos por ITEMAN.
Procesamiento del análisis
Dados los resultados del análisis, los docentes de las asignaturas replantearon ciertas
preguntas o distractores, con la intención que la validez de la prueba fuera alta. Luego de la
modificación de las preguntas, fueron puestas a prueba de nuevo para medir los índices y
24
tener certeza de su idoneidad para la evaluación del aprendizaje a partir de un texto
cotidiano.
Consideraciones éticas
Se le informó oralmente a los estudiantes y docentes el propósito de la
investigación, por lo que se manejó de forma confidencial los nombres de los estudiantes,
de los docentes, ya que no fueron indispensables para el desarrollo del mismo.
25
RESULTADOS Y DISCUSIÓN
Validez de las preguntas
De acuerdo a los resultados obtenidos de la prueba realizada en el 2012, donde se
obtuvo en el índice de confiabilidad de la prueba un alpha de Cronbach de 0.085, el cual se
considera bajo, se realizó un estudio y evaluación exhaustiva de cada una de las preguntas.
A partir de esto, se construyeron los constructos y matrices de desempeño, para que la
modificación de las preguntas, tanto de redacción y de objetivos de evaluación, como de
evaluación, ayudaran a minimizar el error de la pregunta. De esta evaluación se
reestructuraron las preguntas de acuerdo a lo validado por docentes externos, para con ello,
realizar un nuevo pilotaje de la prueba, el cual se hizo con los estudiantes de los grados
Décimo y Undécimo del año 2015.
A partir de éste, y de acuerdo a lo evidenciado gracias a los resultados de ITEMAN,
se modificaron algunos distractores de ciertas preguntas que no estaban funcionando como
tal, es decir, o eran muy evidentes por lo que los estudiantes no los seleccionaban o tenían
mayor aceptación que la opción correcta. Para esto, y con lo establecido en los constructos,
se modificaron dichos distractores para que funcionaran. Como la prueba era nueva en el
Sistema Institucional de Evaluación del colegio, se construyó sin la previa redacción de los
constructos y las matrices de desempeño, para lo cual, luego de la presentación de la prueba
en el 2012 y del análisis de los resultados con ITEMAN, se convocó a los docentes
encargados de cada una de las asignaturas evaluadas, con el fin de generar las matrices de
26
desempeño y la formulación de los constructos para la prueba. A partir de estos nuevos
documentos, se realizó la reestructuración, rediseño o elaboración de las preguntas y así
lograr mejores resultados paramétricos con la presentación de la prueba a estudiantes de los
posteriores años.
Por ejemplo, en el caso de la pregunta #4 de la prueba inicial, los estudiantes que
obtuvieron mejor desempeño total escogieron la opción A, aunque la clave para esta
pregunta era la opción D. Por esto, al construir las matrices de desempeño, la validez de la
pregunta varió significativamente (0.15 a 0.43), dado que inicialmente no se estaba
evaluando algo enseñado plenamente, es decir, sin el uso de los constructos y de las
matrices de desempeño es difícil determinar si lo evaluado es lo que se quiere evaluar, dado
que es a partir de éstas donde el docente puede evidenciar las temáticas enseñadas y la
profundización de las mismas. En la prueba del 2015, esta pregunta funcionó mucho mejor
(índice de discriminación 0.50; para el año 2012 fue de 0.07), demostrando que el concepto
evaluado fue enseñado con idoneidad.
Versión año 2012
Item Statistics Alternative Statistics ----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ -- 4 0-4 .26 .07 .15 A .06 .00 .15 .17 ? B .57 .59 .60 -.01 CHECK THE KEY C .11 .24 .00 -.33 D was specified, A works better D .26 .18 .25 .15 *
27
La fermentación se considera un tipo de respiración porque A. produce la energía celular de forma inmediata. B. usa el oxígeno para producir energía celular (ATP). C. a partir de ella se obtiene energía en forma de ADP. D. contribuye a la formación de NAD+ para producir ATP.
Versión año 2015
Item Statistics Alternative Statistics ----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ -- 6 4-6 .21 .50 .43 A .02 .00 .18 .15 B .66 .80 .42 -.25 C .13 .20 .08 -.17 D .21 .00 .50 .43 *
La fermentación se considera respiración porque A. aparece la energía celular de forma inmediata. B. usa el oxígeno para producir energía celular (ATP). C. a partir de ella se obtiene energía en forma de ADP. D. contribuye a la formación de NAD+ para producir ATP.
En el caso de la pregunta #2 de la prueba del 2012, los rangos de los récords de
densidad de la roca establecidos en los distractores eran muy amplios, haciendo que la
validez y la discriminación de la pregunta fueran bajas (0.15; 0.09). Al modificar los
distractores para la prueba del 2015, los valores de la validez de la pregunta como del
índice de discriminación de la mismas, variaron considerablemente, haciendo idónea la
pregunta para evaluar el concepto de densidad.
28
Versión año 2012
Item Statistics Alternative Statistics ----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ -- 2 0-2 .88 .09 .15 A .03 .02 .09 -.03 B .88 .71 .80 .15 *
C .09 .12 .10 -.15 D .00 .00 .00
La densidad de la roca es 2460 kg/m3
en promedio, la masa de la roca que aún se considera récord en construcción es aproximadamente entre
A. 100 000 kg - 300 000 kg B. 300 001 kg – 500 000 kg C. 500 001 kg – 700 000 kg D. 700 001 kg – 900 000 kg
Versión año 2015
Item Statistics Alternative Statistics ----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ -- 2 4-2 .63 .33 .30 A .13 .20 .00 -.27 B .18 .20 .17 -.12 C .05 .10 .00 -.02 D .63 .50 .83 .30 * La densidad de la roca es 2460 kg/m3
en promedio, la masa de la roca que aún se considera récord en construcción es aproximadamente entre
A. 100 000 kg - 200 000 kg B. 200 001 kg – 300 000 kg C. 300 001 kg – 400 000 kg D. 400 001 kg – 500 000 kg
29
Además de la modificación a partir de los resultados cuantitativos, se revisaron las
preguntas desde la forma y gramática de las mismas, para así, minimizar el error que por
factores humanos disminuyeran la validez de las preguntas y por ende, de la prueba. Como
parte de la mejora de la validez, se adicionaron diez preguntas a la prueba, es decir,
inicialmente se construyeron tres preguntas por asignatura (química, física, biología,
matemáticas y lenguaje) y luego de la reestructuración, la prueba tenía cinco preguntas para
cada una de las asignaturas, para un total de 25 preguntas en total.
Dificultad de las preguntas
La prueba constaba de quince (15) preguntas de las cuales tres de ellas tenían un
grado de dificultad fácil (≥0,75), doce estaban en el rango del nivel medio y la restante era
difícil (≤0,25) (Tabla 1).
Al momento de analizar estos datos, se determinó que la prueba no tenía una distribución
propia en la dificultad de las preguntas (de las quince preguntas el 25% fáciles, 50% nivel
medio y el 25% difíciles), ya que al tener mayor cantidad de preguntas en nivel medio, no
se podía determinar una confiabilidad y discriminación propias de las preguntas de
selección múltiple, además, vale aclarar que estos valores fueron los resultados de la
primera prueba, donde se encontraron distractores con una proporción de selección nula o
donde la opción correcta no era la que escogían los estudiantes con buen desempeño en la
prueba.
30
Tabla 1. Índice de Dificultad de la Prueba Integral año 2012.
Índice de Dificultad: ≤0,25 nivel alto; de 0,26 a 0,74 nivel medio; ≥0,75 nivel bajo
Luego de las modificaciones para mejorar la validez de la prueba, revisando la
proporción de selección de los distractores y adicionando diez preguntas para tener un
grado de confiabilidad menos sesgado dada la cantidad de preguntas, la prueba se le realizó
a los estudiantes de los grados Décimo y Undécimo del año 2015, para evaluar nuevamente
este instrumento; los resultados para esta nueva prueba en el grado de dificultad fueron
cinco preguntas consideradas fáciles (≥0,75), quince en el rango del nivel medio (entre
≤0,74 y ≥0,26) y cinco calificadas como difíciles (≤0,25), esto determina que la prueba ya
tiene la dificultad “ideal” para evaluar los conocimientos de los estudiantes (Tabla 2).
ÍTEM ÍNDICE DE DIFICULTAD
1 0,81 2 0,77 3 0,13 4 0,26 5 0,72 6 0,26 7 0,70 8 0,60 9 0,55 10 0,51 11 0,62 12 0,45 13 0,47 14 0,89 15 0,40
31
Tabla 2. Índice de Dificultad de la Prueba Integral año 2015.
ÍTEM ÍNDICE DE DIFICULTAD
1 0,74 2 0,63 3 0,50 4 0,61 5 0,95 6 0,21 7 0,61 8 0,58 9 0,16 10 0,34 11 0,97 12 0,66 13 0,55 14 0,32 15 0,76 16 0,47 17 0,68 18 0,82 19 0,66 20 0,55 21 0,61 22 0,82 23 0,08 24 0,76 25 0,76
Índice de Dificultad: ≤0,25 nivel alto; de 0,26 a 0,74 nivel medio; ≥0,75 nivel bajo
32
Discriminación de la pregunta
En la prueba inicial, la del 2012, el índice de discriminación promedio fue 0,24,
aunque de las quince preguntas, cuatro de ellas presentaban un índice menor a 0,15 (Tabla
3), por lo que se reestructuraron o eliminaron de acuerdo a los resultados obtenidos. Estas
preguntas no tenían validez alguna, ya que al tener distractores que no fueron seleccionados
por algún estudiante, no había forma para evaluar el funcionamiento de la pregunta y de
cada uno de sus distractores. Además, de estas preguntas que tenían un índice de
discriminación tan bajo, habían tres que tenían un distractor que funcionaba mejor que la
clave, es decir, los estudiantes que obtuvieron mejor desempeño en la prueba,
seleccionaban este distractor en vez de la respuesta correcta.
Tabla 3. Índice de Discriminación de la Prueba Integral año 2012.
Índice de Discriminación: entre –1 y 1.
ÍTEM ÍNDICE DE DISCRIMINACIÓN
1 0,30 2 0,09 3 0,19 4 0,07 5 0,37 6 0,17 7 0,49 8 0,17 9 0,40 10 0,12 11 0,40 12 0,36 13 0,46 14 0,19 15 -0,11
33
En la prueba rediseñada, luego de los resultados del 2012, de las 25 preguntas que
constituyeron la nueva prueba, tres de ellas presentaron una discriminación menor de 0.15,
impidiendo diferenciar los estudiantes con desempeño alto de los de desempeño bajo en la
prueba en estas preguntas. Las otras preguntas, tuvieron un índice de discriminación
promedio de 44,85%. Este índice permite concluir que la prueba posee un grado de
discriminación favorable, permitiendo diferenciar aquellos con un mayor desempeño de los
otros (Tabla 4).
Tabla 4. Índice de Discriminación de la Prueba Integral año 2015.
ÍTEM ÍNDICE DE DISCRIMINACIÓN
1 0,62 2 0,33 3 0,55 4 0,53 5 0,10 6 0,50 7 0,70 8 0,52 9 0,25 10 0,05 11 0,10 12 0,42 13 0,35 14 0,20 15 0,22 16 0,55
34
17 0,43 18 0,50 19 0,43 20 0,28 21 0,45 22 0,52 23 -0,02 24 0,62 25 -0,07
Índice de Discriminación: entre –1 y 1.
Confiabilidad de la prueba
La primera prueba (2012) obtuvo un alfa de Cronbach de 0.085, valor que indicaba
que este instrumento de evaluación no era confiable para evaluar el conocimiento de los
estudiantes de los grados Décimo y Undécimo. Por esto se realizó la reestructuración de la
prueba, donde luego de modificar las preguntas y adicionar diez más, se procedió a
evaluarla nuevamente consiguiendo un valor del alfa de 0.675, el cual nos permite
vislumbrar que la prueba ya tiene un nivel de confiabilidad aceptable, además hay que tener
en cuenta que para disminuir el porcentaje de error experimental, la prueba se resolvió con
estudiantes de los mismos grados pero del año 2015, dado que ya tenían los conocimientos
para resolverla y no habían tenido contacto alguno con ella.
35
PRUEBA PI 2012
Scale: 0 ------- N of Items 15 N of Examinees 47 Mean 8.128 Variance 3.303 Std. Dev. 1.817 Skew 0.172 Kurtosis -0.316 Minimum 5.000 Maximum 13.000 Median 8.000 Alpha 0.085 SEM 1.739 Mean P 0.542 Mean Item-Tot. 0.268 Mean Biserial 0.361 Max Score (Low) 7 N (Low Group) 17 Min Score (High) 9 N (High Group) 20
PRUEBA PI 2015
Scale: 0 ------- N of Items 25 N of Examinees 38 Mean 14.789 Variance 13.587 Std. Dev. 3.686 Skew -0.498 Kurtosis -0.601 Minimum 6.000 Maximum 20.000 Median 15.000 Alpha 0.675 SEM 2.100 Mean P 0.592 Mean Item-Tot. 0.335 Mean Biserial 0.468 Max Score (Low) 12 N (Low Group) 10 Min Score (High) 18 N (High Group) 12
36
CONCLUSIONES
Al momento de modificar la prueba, adicionando diez preguntas (dos más en cada
asignatura), junto con la reestructuración de las preguntas, la confiabilidad de la prueba
aumentó de 0.085 a 0.675, lo que determina que la prueba ya tiene un nivel aceptable para
ser presentada ante los estudiantes. Además, se concluye que es necesario realizar la
redacción de los constructos y de las matrices de desempeño antes de la construcción de
una prueba, ya que es de esta forma como se elimina el sesgo en la validez de la Prueba.
Así se da respuesta a la primera pregunta de investigación: ¿Qué tan válida y confiable es
la Prueba Integral aplicada en el Liceo Campo David? La Prueba Integral “Pi”, luego de la
reestructuración de la misma a partir de los resultados obtenidos a nivel cuantitativo y
cualitativo es idónea, válida y confiable para que los estudiantes demuestren la
aplicabilidad de los conceptos adquiridos.
Al comparar la Prueba Integral “Pi” con las evaluaciones internacionales, se concluye que
tienen objetivos similares al querer evaluar la capacidad que tienen los educandos de
valerse de los conocimientos adquiridos para dar solución a situaciones problema
contextualizadas.
Sin embargo, el modelo y la estructura de las pruebas son diferentes, las evaluaciones
externas se basan en la construcción de una pregunta con un contexto para desarrollar la
habilidad, mientras que la Prueba Integral parte de un texto base (científico, literario,
ilustrado, cotidiano, entre otros) donde se evalúa la capacidad del estudiante para trasladar
37
el concepto a una única situación problema. Así, la Prueba Integral puede ser el medio para
que los resultados en Colombia en estas pruebas internacionales sean mejores y conlleven a
la modificación de las prácticas de enseñanza a nivel nacional.
Este tipo de prueba permite a los estudiantes tener una aproximación a las pruebas de
admisión de algunas universidades, como lo es el de la Universidad Nacional de Colombia
en la sección de análisis textual.
A partir de estas últimas conclusiones, se responde la pregunta: ¿Cómo con una “Prueba
Integral” se pueden evaluar los conocimientos adquiridos por los estudiantes de forma
tradicional?, ya que la Prueba “Pi” al igual que las evaluaciones internacionales, buscan la
aplicabilidad y demostración del uso de los conceptos adquiridos en clase para solucionar
situaciones problema, sin ser respuestas declarativas.
38
REFERENCIAS
Álvarez, J. (2001). Evaluar para conocer, examinar para excluir. Madrid: Morata.
Avalos, H.; Chavez, J.; Henríquez, K.; Hernández, E.; Melara, S.; Pineda, E. (2012).
Prueba objetiva de opción múltiple para educación inicial. Universidad Pedagógica de El
Salvador.
Bazán, J. (2000). Evaluación psicométrica de las preguntas y pruebas CRECER 96.
Documento técnico. Unidad de Medición de Calidad Educativa. Ministerio de Educación.
Perú.
Cano García, E. 1998. Evaluación de la Calidad Educativa. Colección Aula Abierta
Editorial LA MURALLA, S.A.
Haladyna T. M.; Downing S. M. 1989. A taxonomy of multiple-choice ítem-writing rules.
Applied Measurement in Education, 2, 37-50.
Iaies, G.; Bonilla, J.; Brunner, J.; Halpern, P.; Granovsky, M.; Tiana, A.; Martínez, F.;
Navarro, J.; Tenti, E. (2003). Evaluar las evaluaciones. Una mirada política acerca de las
evaluaciones de la calidad educativa. Buenos Aires, IIPE – UNESCO. 194 p.
39
Miller, G. M. (1977). After the testing is over. Elementary School Guidance and
Counseling, 12, 139-143.
Ministerio de Educación Nacional. 2006. Evaluar y promover el mejoramiento. Altablero.
No. 38, Enero y Marzo. Bogotá, p. 4-5.
Murillo, R. 2010. Retos en la evaluación de la calidad de la educación en América Latina.
Revista Ibero-Americana de Educação, 53, 97-120
OREALC/ Santiago (2013). Tercer Estudio Regional, Comparativo y Explicativo. Análisis
Curricular. Santiago de Chile.
Reátegui, N.; Arakaki, M.; Flores, C. 2001. El reto de la evaluación. Plancad-Gtz-Kfm.
Ministerio de Educación. Serie Psicología y pedagogía.
Ruiz-Córdoba, M. 2009. Evaluación vs Calificación. Innovación y Experiencias
Educativas, 16.
Soler Cárdenas, S. F. 2008. Coeficientes de confiabilidad de instrumentos escritos en el
marco de la teoría clásica de los tests. Educ Med Super [online], 22. Disponible en:
http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S0864-
21412008000200006&lng=es&nrm=iso
40
Shulman, L. S. 1986. Those who understand: Knowledge growth inteaching. Educational
Researcher, 15, 4-14.
41
ANEXOS
Anexo 1.
PRUEBA INTEGRAL GRADOS DÉCIMO – UNDÉCIMO AÑO 2012.
LICEO CAMPO DAVID PRUEBA INTEGRAL III
GRADOS DÉCIMO - UNDÉCIMO LOS ACUEDUCTOS ROMANOS
La Roma antigua consumía unos 160 millones de litros de agua cada día, sobre todo en fuentes, estanques, baños y letrinas públicas. Una parte de ese caudal iba directamente a las casas de los ricos, que vivían en villas o en manzanas de casonas de un piso. Pero la gente que habitaba en pisos altos tenía que recoger agua de las fuentes y de los estanques, o contratar los servicios de aguadores profesionales. Canalización del agua: El agua era llevada a Roma por una red de 420 Km. de canales y tuberías desde manantiales, lagos y ríos situados en las montañas de los alrededores; el suministro era continuo, pues no había manera de regularlo. Unas cuantas villas tenían grifos formados por un tubo inserto en el conducto de abastecimiento (llamado quinaria, de unos 2 cm. de diámetro); aquél tenía un orificio por donde fluía el líquido y podía cerrarse o abrirse haciéndolo girar. El agua fluía por gravedad a lo largo de la red. Los canales (acueductos) eran de ladrillo o de piedra con un revestimiento interior de cemento impermeable, y en promedio medían 90 cm. de ancho y 1.8 m de profundidad; algunos eran subterráneos y tenían respiraderos cada 73 m aproximadamente. Suministro por tuberías de plomo: En algunas partes del Imperio el agua era llevada a las ciudades por tuberías de cerámica o de plomo y no por acueductos. El Imperio Romano recubría las cañerías y las bañeras con plomo o con cobre, también empleaba plomo en el recubrimiento en tejados de viviendas. Hervían a fuego lento y fermentaban el vino en recipientes recubiertas de plomo, ya que los de cobre daban mal sabor a la bebida, al hervir a fuego lento se formaba "azúcar de plomo" (en realidad era acetato de plomo). Esto causó muchos casos de saturnismo (un envenenamiento por plomo llamado así porque el plomo era llamado Saturno), pero confundían el envenenamiento por plomo con envenenamiento etílico (debido al consumo de alcohol) por lo que siguieron utilizando el plomo. Muchos alimentos preparados también estaban contaminados por plomo, lo que producía la gota saturnina. Se piensa que la caída del Imperio Romano tiene que ver con el consumo de alimentos y bebidas contaminadas con plomo. Esas tuberías conducían el líquido cuesta abajo por una pendiente del valle y luego cuesta arriba por otra hasta un tramo plano. Un acueducto llevaba agua al antiguo puerto
42
africano de Cartago desde unas montañas situadas a 80 Km. de distancia. El líquido se conservaba en un pozo alimentado por tuberías de arcilla y después fluía hasta la cisterna contigua. Todos los días la gente de los alrededores acudía a sacar agua de ésta metiendo sus baldes por el hoyo del techo ejercía el agua al descender la obligaba a subir hasta dicho nivel. Para fabricar las tuberías se emplearon unas 12 000 toneladas de plomo. PARA SABER UN POCO MÁS... En la Roma imperial, se consumía más de un millón de metros cúbicos de agua al día suministrados por una docena de acueductos, que sumaban 482 Km. de canales cubiertos llamados specus. Los ingenieros romanos, eminentemente prácticos, trazaban los acueductos siguiendo las curvas de nivel del terreno siempre que era posible, y recurrían al uso de túneles, extensas arquerías, puentes o sifones para cruzar las depresiones solo como último recurso. Así, en el caso de Roma, apenas un 5 por ciento de la longitud total de sus acueductos discurría sobre puentes. Los romanos también excavaron numerosos canales para mejorar el drenaje de los campos. Todavía dentro de la disciplina de la hidráulica, los sistemas de elevación y bombeo de agua alcanzaron gran perfección técnica. Así, se conoce gracias al tratado De Architectura de Vitrubio, como funcionaban la rueda y la cadena de cangilones, movidas por energía humana o animal, y la noria, accionada por el empuje de la corriente de donde la rueda toma el agua. Próximos a la noria, desde el siglo IV, existían molinos de agua de tamaño muy considerable. Hacia el año 310, los habitantes de Barbegal, cerca de Arles (Francia), contaban para moler su maíz con una gigantesca instalación formada por 16 ruedas de arcaduces que, por medio de engranajes de madera, accionaban cada una un par de piedras de molino. Los arqueólogos han calculado una capacidad total de molienda en Barbegal de casi tres toneladas de grano por hora. HORMIGÓN, MÁRMOL Y TÉCNICAS NOVEDOSAS Además de la hidráulica, los romanos dominaron la arquitectura y las técnicas constructivas, como lo atestiguan cientos de sus obras que aún permanecen en pie a pesar de su vejez. Y en este punto, contaban con una ventaja sustancial respecto de otras civilizaciones antiguas: disponían de una tierra volcánica llamada puzolana que, mezclada con cal, producía un cemento resistente al agua y al fuego y mezclada con ladrillo o piedra, formaba un hormigón tan duro como los actuales. Este material se usó para cimentaciones y muros, vaciados en encofrados de madera, bóvedas y en lo que constituye otra obra maestra de la arquitectura romana: las cúpulas. El mensaje de Augusto al pueblo romano "Nací en una ciudad de ladrillos y les lego una de mármol" no era exagerado: este material se utilizó profusamente para el adorno y acabado de todo tipo de obras arquitectónicas, por lo que, además de emplear el de las canteras italianas, alcanzó gran importancia como producto de importación. Usaron mucho el mármol travertino, con el que se construyeron los muros del Coliseo, pero también trabajaron la piedra en el resto del Imperio, desde la arenisca del muro de Adriano en Gran Bretaña, hasta la empleada en el templo de Baalbek (Líbano), donde se
43
levantaron tres bloques de piedra que medían 19x4x3 metros, lo que aún hoy en día constituye un auténtico récord de edificación. RESPONDA LAS SIGUIENTES PREGUNTAS DE ACUERDO A LA INFORMACIÓN DEL TEXTO ANTERIOR 1. Los Romanos se aseguraron que los canales descendieran 5 cm cada 100 metros y un
canal specus se extendía unos 50 km. Si esta trayectoria se realiza en línea recta, la altura que ha descendido el agua en este canal es
A. 250 km B. 250 m C. 25 cm D. 25 m 2. La densidad de la roca es 2460 kg/m3
en promedio, la masa de la roca que aún se considera récord en construcción es aproximadamente entre
A. 100 000 kg - 300 000 kg B. 300 001 kg – 500 000 kg C. 500 001 kg – 700 000 kg D. 700 001 kg – 900 000 kg 3. Si a una noria que se mueve con velocidad angular w y a ésta le reducen su radio a la
mitad, entonces si su aceleración centrípeta varía es porque se A. mantiene. B. duplica. C. se divide en dos. D. se cuadruplica. 4. La fermentación se considera un tipo de respiración porque E. produce la energía celular de forma inmediata. F. usa el oxígeno para producir energía celular (ATP). G. a partir de ella se obtiene energía en forma de ADP. H. contribuye a la formación de NAD+ para producir ATP. 5. Algunas personas de Roma, hervían el agua para consumirla. Esto era para A. simplemente calentarla. B. preparar algunos alimentos. C. evitar problemas intestinales. D. eliminar el mal sabor del plomo. 6. Se considera el acetato de plomo un azúcar porque A. proporciona un sabor dulce. B. tiene estructuras hidrofóbicas.
44
C. tiene en su estructura acetona. D. la estructura está sobresaturada. 7. El eje central del texto anterior logra una síntesis temática con las invenciones
culturales griegas, siendo un ejemplo de ello su relación con A. la catarsis. B. la máscara. C. el ágora. D. el coro. 8. Es bien sabido que la obra de Vitrubio mencionada en el texto, se cataloga como una
obra perteneciente al género A. lírico. B. narrativo. C. didáctico. D. dramático.
9. Las escuelas artísticas que retomaron con mayor fuerza los planteamientos de la
escuela clásica y latina fueron A. el modernismo, el vanguardismo y la maledicencia. B. el renacimiento, el neoclasicismo y el romanticismo. C. la literatura precolombina, la literatura independentista y el realismo mágico. D. el realismo, el arte medieval y el barroco. 10. El acetato de plomo (Pb(C2H3O2)2
) era el causante del saturnismo, que en realidad era el envenenamiento por plomo. Dicho compuesto posee la fórmula estructural
Podemos afirmar que en este compuesto orgánico se encuentra la siguiente función química A. ácido carboxílico. B. aldehído. C. cetona. D. éster.
45
11. Cuando la cal viva, CaO, reacciona con el agua se obtiene la cal muerta o cal apagada, este producto de reacción se puede clasificar en el grupo de los
A. sales. B. oxácidos. C. hidrácidos. D. hidróxidos. 12. Durante la época de la Antigua Roma, se confundió el envenenamiento con plomo
con el envenenamiento con alcohol. Para que una persona sufra de intoxicación por alcohol etílico (C2H5
OH), debe tener una concentración de 0,55 g por litro de sangre. Si se estima que la densidad de la sangre es de aproximadamente 1,088 g/mL, la concentración molar de la sangre es
A. 0,1 B. 0,01 C. 0.001 D. 0.0005 13. Si la densidad del agua es 1.0x103 kg/m3
, la cantidad de masa que contiene un metro de canal promedio es
A. 1000 kg B. 1620 kg C. 1000 g D. 16.2 kg 14. El plomo y el cobre se puede fundir debido a una gran cantidad de energía
suministrada al sistema, está se encarga de A. cambiar las propiedades químicas de la materia. B. disminuir la distancia media entre las partículas. C. aumentar la energía de movimiento de las partículas internas. D. disminuir la cantidad de choques que se producen dentro del material. 15. Se conoce que el coeficiente de dilatación lineal del plomo es mayor que el
coeficiente de dilatación lineal del cobre. Frente a esto se puede deducir que los romanos necesitaban _________ ____________ en el cobre para expandir la misma cantidad lineal que el plomo.
A. mayor calor. B. menor calor. C. mayor temperatura. D. menor temperatura.
46
Anexo 2.
PRUEBA INTEGRAL GRADOS DÉCIMO – UNDÉCIMO AÑO 2015.
LICEO CAMPO DAVID PRUEBA INTEGRAL GRADO UNDÉCIMO
LOS ACUEDUCTOS ROMANOS
La Roma antigua consumía unos 160 millones de litros de agua cada día, sobre todo en fuentes, estanques, baños y letrinas públicas. Una parte de ese caudal iba directamente a las casas de los ricos, que vivían en villas o en manzanas de casonas de un piso. Pero la gente que habitaba en pisos altos tenía que recoger agua de las fuentes y de los estanques, o contratar los servicios de aguadores profesionales. Canalización del agua: El agua era llevada a Roma por una red de 420 Km. de canales y tuberías desde manantiales, lagos y ríos situados en las montañas de los alrededores; el suministro era continuo, pues no había manera de regularlo. Unas cuantas villas tenían grifos formados por un tubo inserto en el conducto de abastecimiento (llamado quinaria, de unos 2 cm. de diámetro); aquél tenía un orificio por donde fluía el líquido y podía cerrarse o abrirse haciéndolo girar. El agua fluía por gravedad a lo largo de la red. Los canales (acueductos) eran de ladrillo o de piedra con un revestimiento interior de cemento impermeable, y en promedio medían 90 cm. de ancho y 1.8 m de profundidad; algunos eran subterráneos y tenían respiraderos cada 73 m aproximadamente. Suministro por tuberías de plomo: En algunas partes del Imperio el agua era llevada a las ciudades por tuberías de cerámica o de plomo y no por acueductos. El Imperio Romano recubría las cañerías y las bañeras con plomo o con cobre, también empleaba plomo en el recubrimiento en tejados de viviendas. Hervían a fuego lento y fermentaban el vino en recipientes recubiertas de plomo, ya que los de cobre daban mal sabor a la bebida, al hervir a fuego lento se formaba "azúcar de plomo" (en realidad era acetato de plomo). Esto causó muchos casos de saturnismo (un envenenamiento por plomo llamado así porque el plomo era llamado Saturno), pero confundían el envenenamiento por plomo con envenenamiento etílico (debido al consumo de alcohol) por lo que siguieron utilizando el plomo. Muchos alimentos preparados también estaban contaminados por plomo, lo que producía la gota saturnina. Se piensa que la caída del Imperio Romano tiene que ver con el consumo de alimentos y bebidas contaminadas con plomo. Esas tuberías conducían el líquido cuesta abajo por una pendiente del valle y luego cuesta arriba por otra hasta un tramo plano. Un acueducto llevaba agua al antiguo puerto africano de Cartago desde unas montañas situadas a 80 Km. de distancia. El líquido se conservaba en un pozo alimentado por tuberías de arcilla y después fluía hasta la cisterna contigua. Todos los días la gente de los alrededores acudía a sacar agua de ésta metiendo sus baldes por el hoyo del techo ejercía el agua al descender la obligaba a subir hasta dicho nivel. Para fabricar las tuberías se emplearon unas 12 000 toneladas de plomo. PARA SABER UN POCO MÁS... En la Roma imperial, se consumía más de un millón de metros cúbicos de agua al día suministrados por una docena de acueductos, que sumaban 482 Km. de canales cubiertos llamados specus. Los ingenieros romanos, eminentemente prácticos, trazaban los acueductos siguiendo las curvas de nivel del terreno siempre que era posible, y recurrían al uso de túneles, extensas arquerías, puentes o sifones para cruzar las depresiones solo como último recurso.
47
Así, en el caso de Roma, apenas un 5 por ciento de la longitud total de sus acueductos discurría sobre puentes. Los romanos también excavaron numerosos canales para mejorar el drenaje de los campos. Todavía dentro de la disciplina de la hidráulica, los sistemas de elevación y bombeo de agua alcanzaron gran perfección técnica. Así, se conoce gracias al tratado De Architectura de Vitrubio, como funcionaban la rueda y la cadena de cangilones, movidas por energía humana o animal, y la noria, accionada por el empuje de la corriente de donde la rueda toma el agua. Próximos a la noria, desde el siglo IV, existían molinos de agua de tamaño muy considerable. Hacia el año 310, los habitantes de Barbegal, cerca de Arles (Francia), contaban para moler su maíz con una gigantesca instalación formada por 16 ruedas de arcaduces que, por medio de engranajes de madera, accionaban cada una un par de piedras de molino. Los arqueólogos han calculado una capacidad total de molienda en Barbegal de casi tres toneladas de grano por hora. HORMIGÓN, MÁRMOL Y TÉCNICAS NOVEDOSAS Además de la hidráulica, los romanos dominaron la arquitectura y las técnicas constructivas, como lo atestiguan cientos de sus obras que aún permanecen en pie a pesar de su vejez. Y en este punto, contaban con una ventaja sustancial respecto de otras civilizaciones antiguas: disponían de una tierra volcánica llamada puzolana que, mezclada con cal, producía un cemento resistente al agua y al fuego y mezclada con ladrillo o piedra, formaba un hormigón tan duro como los actuales. Este material se usó para cimentaciones y muros, vaciados en encofrados de madera, bóvedas y en lo que constituye otra obra maestra de la arquitectura romana: las cúpulas. El mensaje de Augusto al pueblo romano "Nací en una ciudad de ladrillos y les lego una de mármol" no era exagerado: este material se utilizó profusamente para el adorno y acabado de todo tipo de obras arquitectónicas, por lo que, además de emplear el de las canteras italianas, alcanzó gran importancia como producto de importación. Usaron mucho el mármol travertino, con el que se construyeron los muros del Coliseo, pero también trabajaron la piedra en el resto del Imperio, desde la arenisca del muro de Adriano en Gran Bretaña, hasta la empleada en el templo de Baalbek (Líbano), donde se levantaron tres bloques de piedra que medían 19x4x3 metros, lo que aún hoy en día constituye un auténtico récord de edificación.
RESPONDA LAS SIGUIENTES PREGUNTAS DE ACUERDO A LA INFORMACIÓN DEL TEXTO ANTERIOR
1. Los Romanos se aseguraron que los canales descendieran 5 cm cada 100 metros y un canal specus se extendía unos 50 km. Si esta trayectoria se realiza en línea recta, la altura que ha descendido el agua en este canal es
A. 250 km B. 250 m C. 25 cm D. 25 m 2. La densidad de la roca es 2460 kg/m3
en promedio, la masa de la roca que aún se considera récord en construcción es aproximadamente entre
A. 100 000 kg - 200 000 kg B. 200 001 kg – 300 000 kg C. 300 001 kg – 400 000 kg D. 400 001 kg – 500 000 kg
48
3. Si a una noria que se mueve con velocidad angular w le reducen el radio a la mitad, entonces la aceleración centrípeta se
A. mantiene. B. duplica. C. divide en dos. D. cuadruplica. 4. La distancia que recorrían los canales sobre puentes corresponde a A. 241 kilómetros. B. 24,1 kilómetros. C. 2410 kilómetros. D. 2,41 kilómetros. 5. Las tuberías son representaciones concretas de cilindros. Para poder hallar el volumen de cualquier
cilindro, se usa la expresión A. π.r2
B. π.d.h .h
C. π. rD. π.h.d
2
6. La fermentación se considera respiración porque A. genera la energía celular de forma inmediata. B. usa el oxígeno para producir energía celular (ATP). C. a partir de ella se obtiene energía en forma de ADP. D. contribuye a la formación de NAD+ para producir ATP. 7. Algunas personas de Roma, hervían el agua para consumirla. Esto era para A. simplemente calentarla. B. preparar algunos alimentos. C. evitar problemas intestinales. D. eliminar el mal sabor del plomo. 8. Se considera el acetato de plomo un azúcar porque A. proporciona un sabor dulce. B. tiene estructuras hidrofóbicas. C. tiene en su estructura acetona. D. la estructura está sobresaturada. 9. Si el plomo tuviera la facultad de permitir el crecimiento de ciertas plantas, esto conllevaría a una
sucesión A. acuática primaria, porque darían origen a nuevas plantas. B. terrestre primaria, porque se originaría un nuevo ecosistema. C. acuática secundaria, porque las plantas secarían el acueducto. D. terrestre secundaria, porque se formaría un nuevo ecosistema terrestre.
49
10. Al inicio de nuestros tiempos, habían organismos que vivían en ambientes parecidos a la puzolana, estos eran
A. procariotas. B. eucariotas. C. protozoos. D. bacterias. 11. Para la época en que América vivía la etapa de Colonización, Leonardo Da Vinci desarrollaba sus
creaciones más ingeniosas, las cuales pueden ubicarse en el marco del periodo artístico A. Medieval. B. Romántico. C. Renacentista. D. Independentista. 12. Es bien sabido que la obra de Vitrubio mencionada en el texto, se cataloga como una obra
perteneciente al género A. lírico. B. narrativo. C. didáctico. D. dramático.
13. Los conectores que aparecen en la última oración del primer párrafo son en su orden A. condicional, causal y de contraste. B. adversativo, copulativo y disyuntivo. C. de secuencia, conclusión y adición. D. temporal, causal y aditivo. 14. Al momento de relacionar los subtítulos del texto se encuentra un desfase en el A. primero porque no hace referencia a la información que le sigue. B. tercero debido a la incoherencia conceptual con respecto al tema que introduce. C. quinto en la medida que utiliza un léxico excesivamente técnico. D. penúltimo pues no sintetiza el tema como si lo hacen los otros. 15. A partir del texto es posible inferir que la relación existente entre la cantidad de dinero de un
romano y la dimensión vertical de su vivienda es A. ambigua. B. inconmensurable. C. inversamente proporcional. D. directamente proporcional. 16. El acetato de plomo (Pb(C2H3O2)2
) era el causante del saturnismo, que en realidad era el envenenamiento por plomo. Dicho compuesto posee la fórmula estructural
50
Podemos afirmar que en este compuesto orgánico se encuentra la siguiente función química A. ácido carboxílico. B. aldehído. C. cetona. D. éster. 17. Cuando la cal viva, CaO, reacciona con el agua se obtiene la cal muerta o cal apagada, este
producto de reacción se puede clasificar en el grupo de los A. sales. B. oxácidos. C. hidrácidos. D. hidróxidos. 18. El proceso de fermentación del vino se lleva a cabo mediante la siguiente reacción C6H12O6 2
CH3CH2OH + 2 CO2
+ 57 kcal, dicho proceso puede considerarse como una reacción de
A. síntesis. B. sustitución simple. C. descomposición. D. doble sustitución. 19. La cal que se mezcla para la producción del hormigón es el mismo óxido de calcio CaO, dicho
compuesto posee un enlace de carácter A. iónico. B. covalente polar. C. covalente apolar. D. covalente coordinado. 20. La fermentación que realizaban los antiguos romanos en recipientes de plomo puede considerarse
como A. un cambio físico. B. un cambio químico. C. una mezcla heterogénea. D. una reacción de descomposición. 21. Si la densidad del agua es 1.0x103 kg/m3
, la cantidad de masa que contiene un metro de canal promedio es
A. 1000 kg B. 1620 kg C. 1000 g D. 16.2 kg
51
22. El plomo y el cobre se puede fundir debido a una gran cantidad de energía suministrada al sistema,
está se encarga de A. cambiar las propiedades químicas de la materia. B. disminuir la distancia media entre las partículas. C. aumentar la energía de movimiento de las partículas internas. D. disminuir la cantidad de choques que se producen dentro del material. 23. Se conoce que el coeficiente de dilatación lineal del plomo es mayor que el coeficiente de dilatación
lineal del cobre. Frente a esto se puede deducir que los romanos necesitaban _________ ____________ en el cobre para expandir la misma cantidad lineal que el plomo.
A. mayor calor. B. menor calor. C. mayor temperatura. D. menor temperatura. 24. El efecto principal de cerrar el diámetro de salida del agua en una quinaria es A. disminuir la velocidad de salida del líquido y disminuir su presión. B. aumentar la velocidad de salida del líquido y aumentar su presión. C. disminuir la velocidad de salida del líquido y disminuir su presión. D. aumentar la velocidad de salida del líquido y disminuir su presión. 25. Las unidades en el sistema internacional de caudal son A. m2
B. L/s /s
C. L/h D. m3
/s
52
CONSTRUCTOS Y MATRICES DE DESEMPEÑO
53
Anexo 3.
Los estudiantes comprenden la elaboración de figuras geométricas y analizan el cambio de proporción de las mismas.
MATEMÁTICAS:
CONTENIDO DECLARATIVO PROCEDIMENTAL ESQUEMÁTICO ESTRATÉGICO
Elaboración de Figuras Geométricas
• Conoce los conceptos de las partes de las figuras geométricas. (pregunta 1) • Conoce los términos volumen, área y espacio. • Crea figuras geométricas a partir de operaciones matemáticas. (pregunta 1)
• Usa instrumentos idóneos para la elaboración de las figuras geométricas. • Dibuja figuras bidimensionales en distintas posiciones y tamaños. • Elabora objetos a partir de las figuras geométricas.
• Relaciona dirección, distancia y posición en el espacio a partir de las figuras geométricas.
• Relaciona eventos cotidianos con la elaboración de las figuras geométricas. • Modela figuras geométricas.
Medidas y proporción
• Conoce los conceptos sobre medición (unidades de medida, magnitud, instrumentos de medición, dirección). (pregunta 1)
• Utiliza instrumentos para realizar mediciones en situaciones problema. • Calcula y convierte las unidades de medida. (pregunta 2)
• Genera una relación o proporción entre diferentes medidas. (pregunta 2) (pregunta 3) • Analiza el uso de unidades de medida en situaciones tomadas de distintas ciencias.
• Diseña estrategias para resolver situaciones de medición.
54
Anexo 4.
BIOLOGÍA:Los estudiantes comprenden la importancia de las Biomoléculas en los seres vivos.
CONTENIDO DECLARATIVO PROCEDIMENTAL ESQUEMÁTICO ESTRATÉGICO
Biomoléculas
• Conoce el término de Biomoléculas: moléculas constituyentes de los seres vivos. • Reconoce los diferentes tipos de Biomoléculas (carbohidratos, proteínas, lípidos, ácidos nucleicos) (pregunta 6) • Conoce la función de las biomoléculas. (pregunta 6) • Reconoce la estructura molecular y química de las biomoléculas.
• Realiza prácticas de laboratorio para la síntesis y reconocimiento de las Biomoléculas.
• Diseña laboratorios para el reconocimiento de las biomoléculas en tejidos animales y vegetales.
Formación de energía
• Conoce el concepto de energía: capacidad para sintetizar moléculas biológicas y desarrollar procesos metabólicos. (pregunta 4) • Reconoce la importancia de la energía a nivel celular en los procesos metabólicos. (pregunta 4) • Reconoce los tipos de síntesis molecular para la formación de energía celular.
• Realiza prácticas de laboratorio para la formación de energía.
• Establecen relación entre las biomoléculas y su influencia en la producción energética. (pregunta 4)
55
Anexo 5.
LENGUAJE:constituidos por categorías formales que organizan el contenido del texto).
Aplican una comprensión lectora intertextual, evolutiva y comprenden la configuración superestructural (esquemas
CONTENIDO NIVEL 1 NIVEL 2 NIVEL 3 NIVEL 4
Comprensión lectora intertextual
• Identifica los factores fundamentales para realizar una adecuada comprensión lectora. (pregunta 7) • Reconoce las ideas principales, tesis, hipótesis de las lecturas. (pregunta 7)
• Infiere información proveniente de varios textos. • Relaciona categorías gramaticales y textuales entre textos. • Realiza ejercicios para la identificación de las ideas, tesis e hipótesis en lecturas y escritos • Compara los distintos tipos de textos y a partir de texto genera una interpretación intertextual. • Compara la información de varios textos, resolviendo preguntas idóneas para la relación intertextual.
• Aplica los conceptos de tesis, idea principal, hipótesis, para la relación de la información intertextual.
Estructuración de la información
• Expone el objetivo de organizar la información. • Cita los conceptos para realizar una adecuada estructuración de la información. • Reconoce diferentes tipos de texto (científico, de divulgación, jurídicos, informativos, narrativos). (pregunta 8)
• Selecciona información relevante de diferentes tipos de textos para estructurarla de acuerdo a la importancia. (pregunta 7) • Compara la información de diferentes tipos de texto. • Categoriza la información recurrente en varios textos. • Conecta e interrelaciona la información relevante de varios textos.
• Argumenta el por qué realizar determinada categorización. • Evalúa la pertinencia de comparar dos o más textos. • Explica la congruencia y la estructuración con base en diferentes tipos de textos.
• Aplica el concepto de superestructura y macroestructura en la comparación de la información de varios textos.
56
Anexo 6.
QUÍMICA:
Comprenden las funciones químicas (inorgánicas y orgánicas) en reacciones de formación y reducción.
CONTENIDO DECLARATIVO PROCEDIMENTAL ESQUEMÁTICO ESTRATÉGICO
Grupos funcionales
• Reconoce el concepto de grupo funcional: centro de reactividad de las moléculas orgánicas. (pregunta 10) • Identifica los diferentes grupos funcionales: alcoholes, éteres, ésteres, cetonas, aldehídos, ácidos carboxílicos, aminas, amidas) (pregunta 10) • Describe la función y localización de cada una de los grupos funcionales.
• Realiza prácticas de laboratorio para la identificación de los grupos funcionales.
• Analiza la composición química de las funciones con su respectivo comportamiento en una reacción.
Reacciones químicas
• Conoce los diferentes tipos de reacciones químicas. (pregunta 11) • Conoce los usos de las reacciones químicas.
• Aplica los conocimientos en prácticas de laboratorio para el reconocimiento de reacciones químicas. (pregunta 12) • Analiza los diferentes tipos de reacciones químicas a partir de la descripción de las formas de combinarse o descomponerse de los reactivos que intervienen en ellas, y de la energía que absorben o emiten cuando se desencadenan.
57
Anexo 7.
Los estudiantes aplican la termodinámica y la mecánica de fluidos en contextos cotidianos.
FÍSICA
CONTENIDO DECLARATIVO PROCEDIMENTAL ESQUEMÁTICO ESTRATÉGICO
Termodinámica
• Conoce el concepto de termodinámica como: fenómenos inherentes a las transformaciones energéticas y sus efectos sobre el estado de la materia. • Conoce las Leyes de la Termodinámica. • Reconoce que un equilibrio
termodinámico implica: equilibrio térmico, mecánico, de fases y químico (pregunta 14)
• Aplica el concepto de sistemas abiertos, cerrados y aislados en problemas cotidianos. (pregunta 15) • Realiza prácticas de laboratorio para determinar el equilibrio de un determinado sistema.
• Diseña sistemas artificiales para modelar el funcionamiento de sistemas naturales.
Mecánica de Fluidos
• Cita que fluido es una sustancia que se deforma continuamente, cuando se le aplica una fuerza tangencial por muy pequeña que ésta sea.
• Conoce los principios de la mecánica de fluidos.
• Describe el comportamiento de variables como diámetro, viscosidad, caudal, volumen, presión y temperatura. (pregunta 13)
• Explicar los fenómenos de la mecánica de fluidos en sistemas naturales a partir de prácticas de laboratorio.
58
Anexo 8.
RESULTADOS OBTENIDOS DE ITEMAN AÑO 2012
ITEMAN (tm) for 32-bit Windows, Version 3.6 Copyright (c) 1982 - 1998 by Assessment Systems Corporation Conventional Item and Test Analysis Program Item Statistics Alternative Statistics ----------------------- ---------------------------------- Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ 1 0-1 .81 .30 .27 A .00 .00 .00 B .11 .18 .00 -.29 C .09 .18 .05 -.06 D .81 .65 .95 .27 * Other .00 .00 .00 2 0-2 .88 .09 .15 A .03 .02 .09 -.03 B .88 .71 .80 .15 * C .09 .12 .10 -.15 D .00 .00 .00 Other .00 .00 .00 3 0-3 .13 .19 .18 A .13 .12 .10 -.03 B .38 .29 .45 .14 C .13 .06 .25 .18 * D .36 .53 .20 -.25 Other .00 .00 .00 4 0-4 .26 .07 .15 A .06 .00 .15 .17 ? B .57 .59 .60 -.01 CHECK THE KEY C .11 .24 .00 -.33 D was specified, A works better D .26 .18 .25 .15 * Other .00 .00 .00 5 0-5 .72 .37 .36 A .02 .06 .00 -.09 B .19 .24 .10 -.21 C .72 .53 .90 .36 * D .06 .18 .00 -.26 Other .00 .00 .00 6 0-6 .26 .17 .20 A .26 .18 .35 .20 * B .28 .24 .30 .04 C .34 .41 .30 -.12 D .13 .18 .05 -.13 Other .00 .00 .00
59
Item Statistics Alternative Statistics ----------------------- ---------------------------------- Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ -- 7 0-7 .70 .49 .46 A .21 .47 .05 -.44 B .04 .06 .05 .04 C .70 .41 .90 .46 * D .04 .06 .00 -.19 Other .00 .00 .00 8 0-8 .60 .17 .15 A .06 .12 .00 -.16 B .32 .35 .25 -.12 C .60 .53 .70 .15 * D .02 .00 .05 .15 Other .00 .00 .00 9 0-9 .55 .40 .46 A .04 .06 .05 -.01 B .55 .35 .75 .46 * C .15 .24 .15 -.13 D .26 .35 .05 -.42 Other .00 .00 .00 10 0-10 .51 .12 .23 A .06 .00 .10 .08 B .04 .12 .00 -.30 C .38 .35 .25 -.15 D .51 .53 .65 .23 * Other .00 .00 .00 11 0-11 .62 .40 .39 A .02 .06 .00 -.17 B .30 .47 .20 -.28 C .06 .12 .05 -.16 D .62 .35 .75 .39 * Other .00 .00 .00 12 0-12 .45 .36 .38 A .11 .18 .05 -.29 B .45 .29 .65 .38 * C .23 .18 .30 .10 D .21 .35 .00 -.35 Other .00 .00 .00 13 0-13 .47 .46 .47 A .45 .71 .25 -.46 B .47 .24 .70 .47 * C .06 .06 .05 -.02 D .02 .00 .00 -.01 Other .00 .00 .00
60
Item Statistics Alternative Statistics ----------------------- ---------------------------------- Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ -- 14 0-14 .89 .19 .29 A .04 .12 .00 -.30 B .00 .00 .00 C .89 .76 .95 .29 * D .06 .12 .05 -.11 Other .00 .00 .00 15 0-15 .40 -.11 -.13 A .43 .41 .55 .18 ? B .11 .12 .10 -.14 CHECK THE KEY C .40 .41 .30 -.13 * C was specified, A works better D .06 .06 .05 .08 Other .00 .00 .00 There were 47 examinees in the data file. Scale Statistics ---------------- Scale: 0 ------- N of Items 15 N of Examinees 47 Mean 8.128 Variance 3.303 Std. Dev. 1.817 Skew 0.172 Kurtosis -0.316 Minimum 5.000 Maximum 13.000 Median 8.000 Alpha 0.085 SEM 1.739 Mean P 0.542 Mean Item-Tot. 0.268 Mean Biserial 0.361 Max Score (Low) 7 N (Low Group) 17 Min Score (High) 9 N (High Group) 20
61
Anexo 9.
RESULTADOS OBTENIDOS DE ITEMAN AÑO 2015
ITEMAN (tm) for 32-bit Windows, Version 3.6 Copyright (c) 1982 - 1998 by Assessment Systems Corporation Conventional Item and Test Analysis Program Item Statistics Alternative Statistics ----------------------- ----------------------------------- Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ --- 1 4-1 .74 .62 .50 A .08 .30 .00 -.43 B .08 .20 .00 -.30 C .11 .20 .08 -.07 D .74 .30 .92 .50 * Other .00 .00 .00 2 4-2 .63 .33 .30 A .13 .20 .00 -.27 B .18 .20 .17 -.12 C .05 .10 .00 -.02 D .63 .50 .83 .30 * Other .00 .00 .00 3 4-3 .50 .55 .46 A .08 .10 .00 -.17 B .32 .60 .08 -.42 C .50 .20 .75 .46 * D .11 .10 .17 .04 Other .00 .00 .00 4 4-4 .61 .53 .47 A .26 .50 .17 -.31 B .61 .30 .83 .47 * C .03 .00 .00 -.08 D .11 .20 .00 -.26 Other .00 .00 .00 5 4-5 .95 .10 .21 A .95 .90 1.00 .21 * B .03 .00 .00 .01 C .03 .10 .00 -.30 D .00 .00 .00 Other .00 .00 .00 6 4-6 .21 .50 .43 A .02 .00 .18 .15 B .66 .80 .42 -.25 C .13 .20 .08 -.17 D .21 .00 .50 .43 * Other .00 .00 .00
7 4-7 .61 .70 .57 A .00 .00 .00 B .18 .30 .00 -.30 C .61 .30 1.00 .57 * D .21 .40 .00 -.39 Other .00 .00 .00
62
Item Statistics Alternative Statistics ----------------------- ----------------------------------- Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ --- 8 4-8 .58 .52 .40 A .58 .40 .92 .40 * B .16 .30 .00 -.25 C .18 .30 .00 -.38 D .08 .00 .08 .15 Other .00 .00 .00 9 4-9 .16 .25 .24 A .37 .50 .33 -.13 B .34 .40 .25 -.14 C .16 .00 .25 .24 * D .13 .10 .17 .13 Other .00 .00 .00 10 4-10 .34 .05 .06 A .34 .20 .25 .06 * B .18 .30 .17 -.18 CHECK THE KEY C .29 .30 .50 .24 ? A was specified, C works better D .18 .20 .08 -.18 Other .00 .00 .00 11 4-11 .97 .10 .30 A .00 .00 .00 B .03 .10 .00 -.30 C .97 .90 1.00 .30 * D .00 .00 .00 Other .00 .00 .00 12 4-12 .66 .42 .47 A .08 .00 .08 .07 B .21 .30 .00 -.41 C .66 .50 .92 .47 * D .05 .20 .00 -.34 Other .00 .00 .00 13 4-13 .55 .35 .34 A .34 .50 .17 -.38 B .55 .40 .75 .34 * C .11 .10 .08 .04 D .00 .00 .00 .00 Other .00 .00 .00 14 4-14 .32 .20 .18 A .11 .20 .00 -.28 B .55 .50 .50 .01 C .03 .00 .00 .01 D .32 .30 .50 .18 * Other .00 .00 .00
63
Item Statistics Alternative Statistics ----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ --- 15 4-15 .76 .22 .14 A .05 .10 .08 -.02 B .03 .00 .00 .01 C .76 .70 .92 .14 * D .16 .20 .00 -.15 Other .00 .00 .00 16 4-16 .47 .55 .43 A .13 .30 .00 -.38 B .05 .10 .00 -.11 C .34 .40 .25 -.12 D .47 .20 .75 .43 * Other .00 .00 .00
17 4-17 .68 .43 .31 A .11 .10 .08 -.07 B .16 .30 .08 -.15 C .05 .20 .00 -.31 D .68 .40 .83 .31 * Other .00 .00 .00
18 4-18 .82 .50 .51 A .11 .30 .00 -.38 B .00 .00 .00 C .82 .50 1.00 .51 * D .08 .20 .00 -.30 Other .00 .00 .00 19 4-19 .66 .43 .38 A .66 .40 .83 .38 * B .21 .30 .17 -.20 C .13 .30 .00 -.29 D .00 .00 .00 Other .00 .00 .00 20 4-20 .55 .28 .16 A .11 .20 .08 -.07 B .55 .30 .58 .16 * C .05 .20 .00 -.34 D .29 .30 .33 .04 Other .00 .00 .00
21 4-21 .61 .45 .38 A .24 .40 .17 -.25 B .61 .30 .75 .38 * C .05 .10 .00 -.27 D .11 .20 .08 -.05 Other .00 .00 .00
22 4-22 .82 .52 .54 A .08 .30 .00 -.51 B .05 .20 .00 -.31 C .82 .40 .92 .54 * D .05 .10 .08 -.02 Other .00 .00 .00
64
Item Statistics Alternative Statistics ----------------------- -----------------------------------
Seq. Scale Prop. Disc. Point Prop. Endorsing Point No. -Item Correct Index Biser. Alt. Total Low High Biser. Key ---- ----- ------- ------ ------ ----- ----- ---- ---- ------ ---
23 4-23 .08 -.02 .02 A .18 .10 .17 .10 B .16 .00 .42 .40 ? CHECK THE KEY C .58 .80 .33 -.38 D was specified , B works better D .08 .10 .08 .02 * Other .00 .00 .00 24 4-24 .76 .62 .57 A .05 .20 .00 -.31 B .76 .30 .92 .57 * C .05 .10 .00 -.31 D .13 .40 .08 -.32 Other .00 .00 .00
25 4-25 .76 -.07 .04 A .08 .10 .00 -.30 B .16 .00 .17 .18 ? CHECK THE KEY C .00 .00 .00 D was specified, B works better D .76 .90 .83 .04 * Other .00 .00 .00 There were 38 examinees in the data file. Scale Statistics ---------------- Scale: 4 N of Items 25 N of Examinees 38 Mean 14.789 Variance 13.587 Std. Dev. 3.686 Skew -0.498 Kurtosis -0.601 Minimum 6.000 Maximum 20.000 Median 15.000 Alpha 0.675 SEM 2.100 Mean P 0.592 Mean Item-Tot. 0.335 Mean Biserial 0.468 Max Score (Low) 12 N (Low Group) 10 Min Score (High) 18 N (High Group) 12
top related