

Prólogo
Uno de los obstáculos que
más consistentemente se han encontrado para realizar un trabajo de análisis de
los instrumentos que utilizamos en la educación consiste en la falta de bases
técnicas con que cuenta el profesor. En este documento se han tratado de
simplificar los procedimientos para la evaluación de las pruebas proporcionando
métodos estadísticos de cálculo rápido, con el propósito de ayudar a los
profesores que no han recibido instrucción específica a realizar un análisis
más técnico sobre los instrumentos de medición que permitan una mejor
evaluación de los procesos educativos con los que se encuentran comprometidos.
Esperando que la información proporcionada sea de valor para el
docente responsable de un proceso tan importante para nuestro país como para
nuestros educandos, deseamos que las páginas siguientes cubran las necesidades
básicas para evaluar el impacto de nuestra labor en quienes dependen de
nosotros para su crecimiento personal.
CENEVAL
CONTENIDOS
Pag.
Cómo planear una prueba
objetiva de rendimiento académico 2
Cómo determinar los contenidos 2
Esquema lineal 2
Cómo definir los resultados 3
Esquema
axial 10
Tipos de preguntas 11
Jerarquías 11
Completamiento 11
Verdadero-Falso 12
Correspondencia 13
Opción múltiple 13
Reglas para redactar preguntas de conocimientos específicos 14
Cómo disponer las preguntas en una prueba 17
Cómo evaluar las preguntas 17
Indice de dificultad 17
Indice de discriminación 19
Cómo evaluar el instrumento 20
Qué es la validez 20
Qué es la confiabilidad 21
Estadística de cálculo
rápido 23
Elementos de muestreo 23
Detección de un elemento extraño 24
La media y la desviación estándar 25
Normalización de datos 26
Correlación entre dos grupos 27
Diferencia entre dos muestras 28
Relacionadas 29
Independientes 29
Diferencia entre varias muestras 30
Tendencia de una serie de datos 30
Bibliografía 35
Anexos
Anexo I (Taxonomías Educativas) 38
Anexo II (Formato para
elaboración de reactivos) 54
Anexo III (Tablas) 57
COMO PLANEAR UNA PRUEBA OBJETIVA
DE RENDIMIENTO
ACADEMICO
Es indispensable que las
especificaciones sean hechas cuidadosamente antes de iniciar cualquier acción,
seleccionando posteriormente los materiales para obtener congruencia con el
plan preconcebido.
El desarrollo del esquema
requiere una detallada consideración de los fines de las unidades de instrucción.
Un procedimiento recomendado es el de desarrollar una tabla, seguida de amplias
categorías que pueden ser subdivididas de acuerdo con la naturaleza de la
instrucción y la complejidad de sus finalidades. Para asegurarnos de que el
campo ha sido adecuadamente considerado, tanto en cuanto a los contenidos, como
al tipo de conducta que se deberá manifestar o utilizar.
Los resultados del
aprendizaje deberán reflejar fielmente los objetivos de la enseñanza del curso.
Mager (1962) sugiere que, para expresar los resultados específicos del
aprendizaje, el enunciado debe comprender tres elementos: a) la conducta
específica de la persona; b) las condiciones en que deberá manifestarse la
conducta, y c) la norma de ejecución para ser aceptada.
Cómo
determinar los contenidos
Toda institución debe tener
su planes y programas de estudio estructurados y registrados, por lo que
podemos partir de los contenidos de cada una de las unidades de instrucción
desglosadas por temas y subtemas. Este nos permite inicialmente desarrollar una
tabla de especificaciones con el esquema lineal[1].
8. El cerebro humano 20
8.1 La evolución 2
8.2 Composición y funciones del cerebro 5
8.3 Cerebro derecho e izquierdo. El sistema dual 6
8.4 Modalidades analógico-digitales de la
comunicación 2
8.5 El sistema dual en el sexo y la educación 3
8.6 Similitud entre modelo y cerebro. Algunas
conclusiones 2
El esquema consiste en la
determinación del número de preguntas que debemos elaborar para cada uno de los
contenidos específicos de una materia, incluyendo el número de preguntas para
cada aspecto, de acuerdo a la importancia relativa de cada subtema con respecto
al tema.
Cómo
definir los resultados
El siguiente paso consiste
en hacer una lista de conductas específicas que se aceptarán como prueba de que
se han logrado los resultados. La forma usual de llevarla a cabo consiste en
seleccionar una forma taxonómica[2] (ver
anexo 1), sugiriéndose inicialmente la de Bloom (1956), por el amplio
conocimiento y aceptación entre medios y autoridades educativas de nuestro
país.
Taxonomía de Bloom
1. Conocimiento
Supone evocación (recuerdo)
de informaciones específicas y universales de métodos y procesos, de
estructuras y modelos. Da mayor énfasis a los procesos psicológicos del
recuerdo y relación, implicando organización y reorganización de un problema,
para que provea los signos y claves útiles para la información y conocimientos
ya poseídos por el que responde.
1.1 Conocimientos específicos
Evocación de información
específica y aislada. Enfatiza símbolos con referencias concretas, con un bajo
nivel de abstracción, pudiendo considerarse constituido por los elementos de
los cuales se deducen formas más complejas y abstractas del conocimiento.
1.1.1 Conocimiento de terminología
Conocimientos con
referencias para símbolos específicos que pueden incluir los más aceptados
generalmente, variedades que pueden utilizarse para una sola referencia o el de
la referencia más apropiada para el uso de determinado símbolo.
·
Definir términos técnicos mediante sus atributos,
propiedades o relaciones.
·
Familiaridad con un extenso número de palabras en sus
significados comunes.
1.1.2 Conocimiento de hechos específicos
Pueden incluir informaciones
muy determinadas y específicas, tales como fechas precisas o la magnitud exacta
de un fenómeno, además de información relativa o aproximada.
·
Evocación de sucesos importantes acerca de
determinadas culturas.
·
Posesión de conocimientos mínimos acerca de los
organismos estudiados en el laboratorio.
1.2 Conocimientos relacionados con las formas o
medios de tratar cosas “específicas”
Se refiere a la forma de
organizar, estudiar, juzgar y criticar, incluyendo tanto los métodos para
investigar, secuencias cronológicas y normas de juicio en determinada área,
como modelos de organización mediante los cuales las áreas del campo de acción
se determinan y organizan internamente. Constituye un nivel de abstracción
intermedio entre los conocimientos específicos y los universales. No demanda
una actividad para usar este material, sino más bien exige una concepción
pasiva de su naturaleza.
1.2.1 Conocimiento de convenciones
Conocer formas
características de tratar y presentar las ideas y fenómenos con propósitos de
comunicación y consistencia. Los que trabajan en determinado campo emplean
estilos, prácticas y formas que sirven mejor a sus propósitos. Debe reconocerse
que, aunque esas formas y convenciones pueden fijarse arbitrariamente, en forma
accidental o basándose en la autoridad, se mantienen debido al acuerdo general
de las personas vinculadas con el tema, fenómeno o problema.
·
Familiaridad con la forma y convenciones de obras de
arte, versos y papeles científicos.
·
Tener conciencia de expresarse correctamente en el
lenguaje oral y escrito.
1.2.2 Conocimientos de tendencias y secuencias
Procesos, direcciones o
movimientos de los fenómenos en relación a un tiempo.
·
Comprensión de la continuidad y desarrollo de la
cultura en sus manifestaciones en la vida americana.
·
Conocimiento de los principios en que se basa el
desarrollo de los programas de servicios de ayuda pública.
1.2.3 Conocimiento de clasificación y categorías
Conocimiento de las clases,
grupos, divisiones y arreglos que se consideran fundamentales en determinada
materia, propósito, argumento o problema.
·
Reconocer el área delimitada por varias clases de
problemas o materiales.
·
Familiarizarse con la clasificación de tipos de la
literatura.
1.2.4 Conocimiento de criterios
Criterios mediante los
cuales se juzgan o comprueban hechos, principios, opiniones y tipos de
conducta.
·
Familiaridad con criterios de juicios apropiados al
tipo de trabajo y al propósito para el cual éste se lee.
·
Conocimiento de criterios para la evaluación de
actividades recreativas.
1.2.5 Conocimiento de la metodología
Conocer métodos de
investigación, técnicas y procedimientos utilizados en determinado campo y los
empleados en investigaciones de problemas y fenómenos particulares. Aquí el
énfasis se encuentra en el conocimiento del método, más bien que en la
habilidad para utilizarlo.
·
Conocer el método científico para la evaluación de la
salud, debiéndose conocer los métodos apropiados para la solución de problemas
sociales.
1.3 Conocimiento de universales y abstracciones
en determinado campo
Conocer planes y modelos
según los cuales se organizan los fenómenos e ideas. Incluye las grandes
estructuras, teorías y generalizaciones que dominan ciertas materias o que se
utilizan generalmente para estudiar los fenómenos o resolver los problemas.
Constituye un nivel de abstracción elevado y complejo.
1.3.1 Conocimiento de principios y generalizaciones
Abstracciones particulares
que resumen las observaciones del fenómeno, siendo de utilidad para explicar,
describir, predecir o determinar las acciones más relevantes y apropiadas o la
dirección que deberá seguirse.
·
Principios importantes por medio de los cuales se
resume nuestra experiencia con los fenómenos biológicos.
·
Evocación de generalizaciones importantes acerca de
ciertas culturas.
1.3.2 Conocimiento de teorías y estructuras
Conjunto de principios y
generalizaciones, así como sus interrelaciones, los que presentan un aspecto
claro, completo y sistemático de un fenómeno, problema o materia compleja.
Constituyen las formulaciones más abstractas y pueden utilizarse para mostrar
la intercorrelación y organización de una amplia variedad de específicos.
·
Evocación de teorías importantes acerca de
determinadas culturas.
·
Conocimiento de la formulación más o menos completa de
la teoría de la evolución.
2. Comprensión
Representa el nivel más
bajo del entendimiento. Se refiere a un tipo de comprensión tal, que el
individuo sabe lo que se le está comunicando y puede utilizar el material o
idea sin relacionarla necesariamente con otro material, o sin la necesidad de
conocer sus implicaciones totales.
2.1 Traducción
Captación evidenciada por
el cuidado y actitud con la cual se parafrasea o se lleva de un idioma o forma
de comunicación a otra. Se evalúa según la fidelidad y exactitud, es decir, el
grado en que se ha preservado el material de la comunicación original, aunque
se haya alterado la forma de la comunicación. La traducción implica versión
objetiva, parte por parte, de una comunicación.
·
Habilidad para comprender afirmaciones no-literales
(metáforas, simbolismo, ironías, exageraciones).
·
Destreza para traducir material matemático verbal o
sus manifestaciones simbólicas y viceversa.
2.2 Interpretación
Explicación o resumen de
una comunicación. La interpretación implica reordenamiento, nuevos arreglos o
nuevos enfoques con respecto al material.
·
Habilidad para captar la filosofía del trabajo en su
totalidad, a diversos niveles de generalización.
·
Habilidad para interpretar tipos de datos sociales.
·
Comprensión de lecturas en general.
2.3 Extrapolación
La extensión de rasgos o
tendencias más allá de los datos suministrados con el objeto de determinar
implicaciones, consecuencias, corolarios, efectos, etc. que están de acuerdo
con las condiciones descritas en la comunicación original.
·
Habilidad para tratar las conclusiones de un trabajo
en términos de inferencias inmediatas basadas en afirmaciones explícitas.
·
Destrezas para predecir la continuación de tendencias.
3. Aplicación
La utilización de
abstracciones en situaciones particulares concretas. Las abstracciones pueden
darse en forma de ideas generales, reglas de procedimiento o métodos
generalizados. Las abstracciones pueden también consistir en principios
técnicos, ideas y teorías que deben ser recordadas y aplicadas.
·
Aplicación de términos o conceptos científicos
utilizados en un trabajo de investigación, al fenómeno discutido en otra
investigación.
·
Habilidad para predecir el efecto probable de un
cambio en un factor o situación biológica que se encuentra en equilibrio.
Tipos de conducta:
a) Seleccionar el principio correcto y demostrar
cómo se aplica al problema. Debe anotar el proceso de aplicación completo y
explicar los principios envueltos.
b) Anotar la solución al problema demostrando
que se conoce el proceso de aplicación de obstrucciones.
c) Anotar la solución en forma tal que pueda
inferirse si aplicó los principios en su solución.
Tipos de problemas:
a) Situación ficticia.
b) Utilizar materiales que no están fácilmente
accesibles al examinado y que a veces consiste en simplificar una situación
compleja.
c) Presentar en otra forma situaciones
corrientes o familiares.
d) Buscar nuevas maneras de observar fenómenos
ordinarios.
4. Análisis
Subdivisión de una
comunicación en sus elementos o partes constitutivas, en forma tal que la
jerarquía relativa a las ideas se aclare o que la relación entre las ideas
expresadas se haga explícita. Por estos análisis se intenta aclarar la
comunicación, indicar cómo se origina y la forma en que transmite sus efectos,
sus bases y su distribución.
4.1 Análisis de elementos
Identificación de los
elementos incluidos en la comunicación
·
Habilidad para reconocer suposiciones expresadas.
·
Destreza para distinguir los hechos de las hipótesis.
4.2 Análisis de relaciones
La concepción e interacción
entre los elementos y partes de una comunicación.
·
Habilidad para comprobar la consistencia de las
hipótesis con informaciones y suposiciones dadas.
·
Habilidades para captar las interrelaciones entre las
ideas de un párrafo.
4.3 Análisis de principios organizados
La organización, arreglo
sistemático y estructura de una comunicación. Incluye estructuras implícitas y
explícitas, las bases, arreglos y mecanismos necesarios para transformar la
comunicación en una unidad.
·
Habilidad para reconocer las formas y modelos de los
trabajos literarios y artísticos como un medio de comprender su significado.
·
Habilidad para reconocer las técnicas generales
utilizadas en los materiales persuasivos, tales como avisos, propaganda, etc.
5. Síntesis
Juntar las partes y
elementos para constituir un todo. Implica el proceso de trabajar con piezas,
partes, elementos, etc. y arreglarlos de tal forma que constituyan un modelo o
estructura no evidente hasta entonces.
5.1 Producción de una comunicación única
Producir una comunicación
en la cual el escritor u orador trate de transmitir a otros sus ideas,
sentimientos y/o experiencias.
·
Destreza para escribir, utilizando una excelente
organización de las ideas y de la exposición.
·
Habilidad para narrar una experiencia personal en
forma acertada.
5.2 Producción de un plan o de un conjunto de
actos planeados
El desarrollo de un plan de
trabajo o la proposición de un plan de acción. El plan debe cumplir con los
requisitos de la tarea que debe darse a los que responden o que deben
desarrollar por sí mismos.
·
Habilidad para proponer formas de comprobar las
hipótesis.
·
Habilidad para planear una unidad de educación para
cierta situación de enseñanza.
5.3 Deducción de un conjunto de relaciones
abstractas
El desarrollo de un conjunto
de relaciones abstractas, ya para clasificar o explicar un dato o fenómeno
particular, la deducción de proposiciones y relaciones de un grupo de
posiciones o de representaciones simbólicas.
·
Habilidad para formular hipótesis en el análisis de
factores implicados y para modificar estas hipótesis a la luz de nuevas
consideraciones y factores.
·
Habilidad para hacer descubrimientos matemáticos y
generalizaciones.
6. Evaluación
Juicios acerca del valor
del material y de los métodos para determinados propósitos. Los juicios
cualitativos y cuantitativos acerca del grado en que el material y los métodos
satisfacen los criterios. Utilización de pautas (patrones o normas) de
apreciación. Los criterios pueden ser determinados por los que responden o les
pueden ser dados.
6.1 Juicios en función de la evidencia interna
Evaluación de la exactitud
de una comunicación según evidencias del tipo de la exactitud lógica, la
consistencia u otro criterio interno.
·
Juzgar de acuerdo a pautas internas, la habilidad para
determinar la probabilidad general de la actitud al informar sobre el cuidado
que se ha dado a la exactitud de exposición, documentación, demostración, etc.
·
Habilidad para indicar falacias, lógicas en el
argumento.
6.2 Juicios en términos de criterios externos
La evaluación del material
en cuanto a los criterios seleccionados o recordados.
·
La comparación de teorías, generalizaciones y hechos
relativos a ciertas culturas.
·
Juzgar, de acuerdo a pautas externas, la habilidad
para comparar un trabajo con las normas más altas conocidas en este campo,
especialmente con otros trabajos de reconocida calidad.
El uso de una taxonomía nos
permite aplicar un esquema axial a la tabla de especificaciones, haciendo más
preciso nuestro muestreo de contenidos. Este esquema contiene dos ejes, siendo
utilizado el vertical para los contenidos y el horizontal para la taxonomía.
Niveles taxonómicos:
1. Conocimiento 2.
Comprensión
3. Aplicación 4. Análisis
5. Síntesis 6. Evaluación
|
Contenidos |
Estímulos |
Taxonomías |
||||||
|
Temas y Subtemas |
Parcial |
Total |
1 |
2 |
3 |
4 |
5 |
6 |
|
12 |
2 |
2 |
2 |
2 |
2 |
2 |
||
|
Tema I |
|
6 |
2 |
1 |
1 |
1 |
1 |
|
|
Subtema a |
2 |
|
1 |
|
1 |
|
|
|
|
Subtema b |
3 |
|
1 |
1 |
|
1 |
|
|
|
Subtema c |
1 |
|
|
|
|
|
1 |
|
|
Tema II |
|
6 |
|
1 |
1 |
1 |
1 |
2 |
|
Subtema a |
4 |
|
|
1 |
1 |
1 |
|
1 |
|
Subtema b |
2 |
|
|
|
|
|
1 |
1 |
Fig. 2. Esquema axial
COMO ELABORAR PREGUNTAS OBJETIVAS
Los estímulos de una prueba
objetiva pueden ser de diferentes formas, aunque diversas investigaciones han
demostrado que los de opción múltiple son los más estables, por lo que son los
de uso más común. Las investigaciones también han demostrado que los estímulos
de opción múltiple con cuatro posibilidades son los mejores, siempre que se
inicie con cinco opciones y se elimine la que consistentemente tenga menor
frecuencia de respuestas (ver anexo 2).
Tipos
de preguntas
1. Jerarquías
Este tipo de pregunta puede
dar lugar a problemas de calificación por algún orden aproximado. Es posible
determinar todos los posibles patrones de respuesta y computar el coeficiente
de correlación por rangos para cada uno de ellos. En este caso el número de puntos
asignados será proporcional al grado de correlación. Esta opción soluciona la
forma de calificación, pero depende de la habilidad y persistencia del
calificador, sobre todo cuando el número de estudiantes es grande.
Otra
posibilidad consiste en reducir el número de elementos a ordenar (v.g: tres), que permitan seis posibles
combinaciones de ordenamiento y argumentar que se asignará un punto por el
ordenamiento correcto y ninguno por los demás. No obstante, deberá tratarse
como una pregunta de seis opciones, a menos que se elimine el orden menos
probable.
Por
lo anterior, sólo se sugiere o se justifica en casos muy especiales en los que
algún ordenamiento implique una forma de conocimiento que no es posible probar
de otra forma.
2. Completamiento
Es el único que le pide al
examinado que proporcione la respuesta en lugar de elegirla, debiéndose elegir
sólo en los casos en los que el suministro de respuesta sea parte necesaria del
resultado de aprendizaje, o cuando la selección haga la respuesta obvia, teniendo
dos problemas principales de elaboración:
·
es muy difícil redactar la pregunta o enunciado
incompleto, de manera que sólo haya una respuesta correcta;
·
incluye problemas de ortografía, redacción y
caligrafía.
Reglas para su elaboración
a. Enuncie la pregunta de modo que sólo sea
posible una respuesta o respuestas claramente equivalentes.
b. Comience con una pregunta directa y relacionada
con un enunciado incompleto sólo cuando sea posible una mayor consistencia. Los
enunciados tienden a ser menos ambiguos cuando se plantean como preguntas.
c. Las palabras que se empleen deben relacionarse
con el punto principal del enunciado. No pida respuestas superfluas y deje
espacios sólo para palabras clave.
d. Coloque los espacios al final del enunciado.
Esto permite que el estudiante lea el enunciado completo antes de contestar.
e. Evite claves ajenas a la respuesta. Artículos
indefinidos (un o una), pronombres (él o ella) o la longitud
del espacio blanco al final del enunciado pueden ser un determinante específico.
f. Con respuestas numéricas, indique el grado de
precisión deseado y las unidades en que se deben expresar.
3. Verdadero-Falso
Es el más conocido
debiéndose usar cuando sólo haya dos respuestas posibles, pero menos
recomendable por las siguientes desventajas:
·
se tiende a elegir sentencias literales de un libro,
propiciando la memorización en el estudiante y limitándose a datos concretos;
·
es difícil incorporar una norma absoluta de veracidad
o falsedad;
·
a menudo conducen a reacciones emocionales;
·
permite un 50% de acierto a personas sin
conocimientos;
·
cuando el estudiante marca como falso un enunciado, no
hay forma de determinar qué conceptos erróneos tenía cuando lo hizo, careciendo
de posibilidades diagnósticas;
·
el hecho de marcar falso un enunciado no garantiza que
el estudiante sepa la contraparte verdadera.
Reglas para su elaboración
a. Incluya en cada enunciado sólo una idea central
significativa.
b. Redacte el enunciado de forma tan precisa que
se le pueda juzgar como verdadero o falso sin equivocación, evitando
determinantes específicos (rara vez, con frecuencia, puede ser, a menudo,
etc.).
c. Los enunciados deben ser breves y de estructura
sencilla.
d. Trate de no usar enunciados negativos y evite
la doble negación.
e. Los enunciados de opinión se deben atribuir a
alguna causa.
f. Evite claves ajenas a la respuesta, como
determinantes específicos que tienden a ser falsos (siempre, nunca, todo, ninguno, etc.), o que tienden a ser verdaderos (usualmente, a veces, acaso, etc.).
Los enunciados verdaderos tienden a ser más largos por la necesidad de
modificadores.
g. Ubique las respuestas correctas al azar, para
evitar que series constantes sirvan como determinantes específicos.
4. Correspondencia
Es una forma modificada del
estímulo de opción múltiple donde se enlistan en una columna una serie de premisas y en la otra columna las respuestas posibles. No obstante, a
menos que todas las respuestas sirvan como opciones razonables para cada
premisa, el formato será inadecuado. Hay dos errores comunes al elaborar este
tipo de estímulo:
·
tendencia a mantener la misma cantidad de premisas y
respuestas;
·
incluir demasiados elementos en ambas listas.
Reglas para su elaboración
a. Incluya sólo material homogéneo en cada
estímulo, como “autores y obras”, “científicos y descubrimientos”, “conceptos y sus definiciones”, etc. para
que las respuestas sean razonables.
b. Utilice listas de tamaño razonable y ubique las
respuestas a la derecha; esto permite una mayor facilidad de lectura y
búsqueda.
c. Utilice un número de respuestas menor o mayor
que el de las premisas y haga que las respuestas se puedan usar más de una vez,
para reducir la respuesta por tanteo.
d. Especifique en las instrucciones las bases de
la correspondencia e indique que cada respuesta puede usarse una o más veces o
no usarse.
5. Opción múltiple
En su formato más usual, el
cual incluye un enunciado (base o
postulado) y las opciones que contienen una clave (respuesta correcta) y varios distractores (respuesta incorrectas o incompletas).
Por
las características antes mencionadas, se podrá comparar con ventaja este tipo
de estímulos, con respecto a los demás, debiendo idealmente presentar una tarea
acorde con el conocimiento, claramente inteligible y que sólo puedan
contestarla correctamente quienes hayan logrado el aprendizaje deseado. Entre
sus ventajas podemos mencionar las siguientes:
·
contienen en sí mismos la norma, partiendo de la cual
se puede escoger la mejor respuesta;
·
la mejor contestación que pueda dársele no tiene que
ser necesariamente la única e indiscutible respuesta correcta a la pregunta,
pudiéndose defender como la mejor de las
opciones que se presentan;
·
permite una más amplia latitud en la selección de
conceptos que los estímulos de verdadero-falso;
·
es muy flexible, permitiendo que varios sean dirigidos
hacia el mismo conocimiento o que diferentes estímulos sean seleccionados
dentro del mismo grupo de opciones;
Reglas para su elaboración
a. Elabore cada estímulo para medir un resultado
importante del aprendizaje. Debe ser congruente y contingente con los objetivos
de aprendizaje. Evite aumentar la dificultad eligiendo estímulos oscuros y
menos significativos del conocimiento.
b. Presenta sólo un problema, claramente
formulado, en el enunciado. Debe entenderse sin necesidad de leer las opciones.
c. Redacte el enunciado en lenguaje claro y
sencillo. No sobrecargue el enunciado con material no pertinente por el deseo
de seguir enseñando hasta cuando se somete al estudiante a una prueba.
d. Incluya tantas palabras como sea posible en el
enunciado del estímulo. Evite repetir el material en cada opción incluyendo el
contenido común en el enunciado.
e. Redacte el enunciado en forma afirmativa
siempre que sea posible. Esto tiende a medir resultados de aprendizaje más
importantes por el mayor significado que tiene el conocer las cosas positivas
con respecto a las negativas. Que el estudiante sea capaz de identificar
respuestas que no se aplican, no nos
asegura que posea el conocimiento deseado.
Por las características
antes mencionadas de ahora en adelante nos referiremos solamente a las pruebas
objetivas con estímulos de cinco opciones.
Reglas para redactar
preguntas de conocimientos específicos.
Aspectos generales
1.
Cada estímulo debe
presentar, por sí mismo, un problema que al ser resuelto permita demostrar que
se ha alcanzado un objetivo determinado, relacionado con conocimiento,
destreza, habilidad o potencial de aprendizaje.
2.
Los estímulos deben ser
independientes unos de otros, sin que la información contenida en uno sugiera
la solución de otro, ni la respuesta de un estímulo antecedente sea necesaria
para poder contestar a un estímulo posterior.
3.
Debe ser lo suficientemente
diferente de cualquier otro estímulo, sin traslaparse en contenido o
vocabulario.
4.
La elección de una respuesta
debe estar basada, fundamentalmente, en la comprensión de la estructura.
5.
Si se solicita una opinión
o un juicio evaluativo debe pedirse, siempre que sea posible, que la persona
exprese su opinión según las autoridades que el estímulo especifica y no su opinión
personal. En caso de que la autoridad no esté citada, el enunciado debe
contener los elementos de juicio necesarios para que la respuesta sea lo más
objetivo posible.
Para materiales verbales
1.
El lenguaje usado en la
redacción de un problema debe ser apropiado para la materia que cubre,
particularmente en lo que se refiere al vocabulario técnico.
2.
Se recomienda usar
contenidos que provean el contexto suficiente para inferir el significado y
encontrar distractores.
3.
Pueden seleccionarse
estímulos que den una idea de contraste, explicación, comparación o ilustración
de la idea central.
4.
Seleccione contenidos que
estén gramaticalmente correctos y expresados en un estilo formal o aceptable.
5.
Los artículos o
preposiciones que acompañan a los sustantivos deberán formar parte del
enunciado. Si no son iguales para todas las opciones, deben ser colocados en
cada una de ellas.
6.
Las partes de la oración
(sustantivos, verbos, etc.) que se usan en las opciones deben ser congruentes
con las partes usadas en el enunciado. Si el enunciado presenta, por ejemplo,
una relación sustantivo : verbo, todas las opciones deben seguir el mismo
patrón.
7.
Evite las relaciones
estereotipadas en el enunciado y en la clave. Pueden servir sólo como
distracción.
8.
Los estímulos que miden
comprensión deben ser diferentes a los que el que contesta ya ha resuelto. Esto
evita soluciones aprendidas de memoria.
9.
El enunciado debe presentar
sólo un problema central. Si al leer el enunciado, ocultando las opciones, se
puede entender de qué se trata el problema, el estímulo cumple con este
requisito.
10.
El problema debe expresarse con precisión. Debe quedar
bien claro cuál es el propósito del estímulo, evitando ambigüedades.
11.
El estímulos deben redactarse con sencillez y
corrección. El problema no debe medir habilidad para
comprender estructuras gramaticales complejas, excepto cuando se está midiendo
esta habilidad en particular.
12.
En la mayoría de los casos el problema debe contener
sólo material relevante a su solución. Esta regla no rige aquellos estímulos en
que se requiere determinar si el que responde puede evaluar la relevancia de
ciertos datos.
13.
Siempre que sea posible, el estímulo debe redactarse
en sentido afirmativo para evitar trivialidades.
Para el enunciado
1.
Si se solicita una opinión
o un juicio evaluativo debe pedirse, siempre que sea posible, que la persona
exprese su opinión según las autoridades que el estímulo especifica y no su
opinión personal. En caso de que la autoridad no esté citada, el enunciado debe
contener los elementos de juicio necesarios para que la respuesta sea lo más
objetivo posible.
Para las opciones en
general
1.
Las opciones deben ser tan
breves como sea posible. Cuando son excesivamente largas, casi siempre incluyen
problemas adicionales al expuesto en el enunciado. Muchas veces incluyen
palabras o frases que deben ser parte del enunciado y no de las opciones.
2.
Las sugestiones
irrelevantes a la solución deben alejar del problema al que responde, si es que
no sabe responder correctamente. No debe sugerirse cuál es la opción correcta.
·
A veces puede haber demasiada semejanza de estilo
entre la solución correcta y el enunciado.
·
La simple asociación de sonido o forma entre una
palabra clave en el enunciado y una palabra clave de una opción puede implicar
que se elija ésta.
·
Términos demasiado inclusivos ( v.g.: nunca,
siempre,
nadie,
todos,
único)
deben evitarse en las opciones erróneas y usarse ocasionalmente en la correcta.
·
Debe evitarse que haya incongruencia gramatical entre
las opciones y el enunciado, ya que éstas ayudan a la selección de las
respuestas correctas, aun sin conocer el contenido.
·
No deben usarse opciones que sólo representen la
incapacidad de pensar en otras posibilidades (v.g.: ninguna de las anteriores,
o todas
las anteriores).
·
Opciones que son mucho más cortas o largas con
respecto a las demás, tienden a ser obviamente correctas o incorrectas.
3.
Use palabras con las cuales
los examinados estén relativamente familiarizados. La elección de la respuesta
debe estar basada, fundamentalmente, en la comprensión de la estructura y del
estilo de la oración y no sólo del vocabulario.
4.
No se deben usar las mismas
palabras del enunciado entre las opciones.
Para la clave
1.
La respuesta correcta (clave) debe ser incuestionable. Por lo
menos dos personas deberán revisar el estímulo para determinar si la solución
correcta está clara.
Para los distractores
1.
Opciones que provienen de
otros campos que no son los que se consideran en el enunciado, deben evitarse
por ser obviamente erróneos.
2.
Las opciones incorrectas
(distractores) deben presentar los errores comunes en el pensamiento de las
personas del nivel al que corresponde y no del público en general. Las opciones
obviamente incorrectas no son deseables, pues reducen la capacidad de
discriminación del estímulo.
3.
Use los que sean gramatical
o idiomáticamente correctos.
4.
Evite la misma palabra en
más de un distractor.
5.
Si hay dos espacios en
blanco, los distractores pueden estar elaborados de tal manera que una de las
palabras que complete los espacios sea correcta y la otra no lo sea.
6.
Se debe evitar lo capcioso
en los distractores, por ejemplo, no usar sinónimos perfectos al elaborar una
prueba de antónimos o viceversa.
Cómo disponer las preguntas
en una prueba
Cuando se ha completado la
elaboración y selección de estímulos y se requiere integrarlos en una prueba,
debemos tomar en cuenta otros aspectos adicionales:
1. Deben disponerse de modo
que todas queden dentro del mismo grupo. Esto permite utilizar las mismas
instrucciones de respuesta, contribuyendo a una solución eficaz y simplificando
la calificación y el análisis de los resultados.
2. Deben disponerse en orden
de dificultad creciente. Esto tendrá un efecto motivacional favorable en el
estudiante. Si se han dispuesto por grupos de contenidos, estos también deberán
quedar por dificultad creciente.
COMO EVALUAR LAS PREGUNTAS
Toda pregunta en una prueba
tiene un componente de varianza de error adjudicable al evaluador y no al
estudiante; por esto debemos verificar si la pregunta es pertinente al grupo de
estudiantes al que está siendo aplicada.
Las preguntas tienen dos
indicadores clásicos para determinar su calidad: a) índice de dificultad y, b)
índice de discriminación.
Para las pruebas de
aprovechamiento utilizadas para evaluación en aula existen procedimientos
sencillos que, a pesar de no ser estimaciones exactas, nos permiten una mayor
calidad en nuestros procesos evaluativos al aplicarlos al análisis de
estímulos. Sólo se justifican procedimientos más complejos cuando se requiere
una mayor precisión en estudiantes que concursan por un objetivo especial
(v.g.: pruebas admisión).
En general, una pregunta de
alta calidad se espera que sea acertada por la mitad de los estudiantes y
fallada por la mitad restante, siempre y cuando la mitad de estudiantes que
acierte sea la de mejor aprovechamiento y viceversa.
Indice de dificultad
Las preguntas tienen una
dificultad relativa de acuerdo con el grupo y nivel en que se apliquen. Una
pregunta con una baja frecuencia de acierto tiene una dificultad mayor que otra
con una frecuencia alta.
En una prueba de cinco
opciones se espera que la respuesta correcta sea contestada por la mitad de los
estudiantes, como se mencionó anteriormente. Sin embargo, no siempre es
factible obtener la situación óptima, por lo que se espera una oscilación en la
probabilidad de respuesta determinada por 1/k
(total posible entre el número de opciones de respuesta). Cada opción tendrá,
en el caso de cinco opciones, un 20% de probabilidades de ser elegida, por lo
que la opción correcta podrá oscilar entre un 20% y un 80%, con un 50% como
valor óptimo de acierto.
Ejemplo
Supongamos que tenemos 40
estudiantes en nuestro grupo y les aplicamos una prueba de cinco opciones de
respuesta. Después de calificarlos, los ordenamos de mayor a menor calificación
y los dividimos por la mitad. Si la mitad de los estudiantes no corta los
resultados en forma clara para el grupo alto y el bajo, la calificación central
que incluya casos de ambos subgrupos deberá cederse completa al subgrupos que
posea mayoría y, en caso de ser iguales, elija arbitrariamente en que subgrupo
desea incluirlos, teniendo en cuenta que se favorece al subgrupo bajo o se
desfavorece al grupo alto cuando se le asigna el paquete completo. Una forma de
nivelar este sesgo consiste en eliminar la calificación media, cuando contiene
estudiantes de ambos subgrupos.
Opciones
|
A |
B* |
C |
D |
E |
|
Superior 20 |
1 |
12 |
4 |
2 |
1 |
|
Inferior 20 |
5 |
3 |
3 |
7 |
2 |
|
Total 40 |
6 |
15 |
7 |
9 |
3 |
* = respuesta correcta
![]()
![]()
El
índice de dificultad será la frecuencia de respuestas en la clave (15), entre
el número total de personas (40):
Lo anterior nos indica que
es admisible por estar entre[3]
Si es acucioso, podrá hacer
otro tipo de análisis mediante criterios adicionales.
![]()
a) Ningún
distractor deberá tener menor frecuencia de respuestas que:
N = número de personas
![]()
k = número
de opciones
Observe que la opción E no cubre el criterio, por lo que
deberá modificarse o cambiarse para mejorar la calidad de la pregunta.
Índice de discriminación
El índice de discriminación
nos permite determinar si la pregunta la aciertan más frecuentemente los
estudiantes de alto rendimiento, comparados con los estudiantes de bajo rendimiento.
La forma habitual de
cálculo implica dividir al grupo en dos subgrupos que contengan entre el 25% y
el 50% del total de estudiantes evaluados, siendo mejor utilizar la alternativa
del 50% por ser más representativo del grupo[4].
Si la prueba y las
preguntas tienen las características mencionadas en los temas anteriores, se
espera que el estudiante que conteste mayor cantidad de preguntas corresponda
al que tiene un mayor rendimiento en la materia y viceversa, por lo que al
dividirlos en subgrupos con estas características tendremos un punto de
referencia de la calidad del aprendizaje para evaluar las preguntas de la
prueba.
Opciones
|
A |
B* |
C |
D |
E |
|
Superior 20 |
1 |
12 |
4 |
2 |
1 |
|
Inferior 20 |
5 |
3 |
3 |
7 |
2 |
|
Total 40 |
6 |
15 |
7 |
9 |
3 |
* = respuesta correcta
El índice de discriminación
será dos veces (2) la frecuencia de respuestas del grupo superior en la opción
correcta (12), menos la frecuencia de respuestas del grupo inferior en la
opción correcta (3), entre el número total de personas (40).
![]()
![]()
![]()
El resultado
deberá ser mayor o igual que el límite crítico (Lc)[5] para ser
aceptado.
Como en el caso anterior,
podrá hacer otro tipo de análisis mediante criterios adicionales.
a) Ningún distractor deberá
ser contestado con mayor frecuencia en el grupo alto:
La opción C no cumple este requisito, por lo que
debemos tratar de modificarla o cambiarla.
Podemos observar que la
pregunta cumple tanto el índice de dificultad como el de discriminación, por
que podemos aceptarlo aún cuando tratemos de mejorarlo cambiando las opciones C y E.
Este procedimiento deberá
seguirse para el análisis de todas las preguntas de la prueba para mejorar la
calidad de la evaluación[6].
COMO EVALUAR EL INSTRUMENTO
Toda prueba tiene un
componente de varianza de error adjudicable al evaluador y no al estudiante;
por esto debemos verificar si la prueba es pertinente al grupo de estudiantes
al que está siendo aplicada.
Las pruebas tienen dos
indicadores clásicos para determinar su calidad: a) índice de validez y, b)
índice de confiabilidad.
Qué es la validez
La validez de un instrumento
consiste en que podamos medir lo que
pretendemos que mida. Por esto es importante que tengamos muy en cuenta la
necesidad de elaborar nuestra tabla de
especificaciones garantizando que incluye todos los contenidos temáticos que debe incluir, así como el nivel taxonómico en el que queremos
lograr el aprendizaje. Esto nos permitirá tener consciencia del total de
conocimientos y la profundidad que requerimos, correspondiendo al total de las
características educativas (constructo)
que esperamos lograr.
Además, nos permitirá
realizar un muestreo del constructo que sea representativo de los conocimientos
y la profundidad de los mismos que deberá contener nuestro instrumento para que
cumplamos con la definición (contenido).
Lo mencionado en el párrafo
anterior corresponde a la validez
teórica del instrumento que contiene los aspectos de validez constructo y
contenido. La primera implica la utilización del universo de conocimientos que
deseamos incluir y la segunda el muestreo representativo de ese universo.
Aparte de la validez
teórica existe la validez empírica
que implica el impacto de lo aprendido en un futuro previsible (predictiva) y la relación que tiene lo
aprendido con otros aspectos importantes en el proceso de enseñanza-aprendizaje
(concurrente).
Normalmente un profesor
deberá trabajar para lograr la validez teórica con su grupo de alumnos, pero
ocasionalmente deseará saber si el éxito o fracaso en su materia está
relacionado con el éxito o fracaso en otras materias (concurrente), o si los conocimientos adquiridos implican una mayor
probabilidad de ser aceptado en un nivel de estudios posterior o en el campo de
trabajo (predictiva).
Qué es la confiabilidad
Se refiere a la precisión o
permanencia con la que podemos obtener la
misma medición en diferentes condiciones.
En algún caso la condición
será el paso del tiempo (estabilidad
temporal), es decir, que sin que medie ningún aprendizaje extra, la persona
que es medida en dos momentos diferentes debe dar las mismas respuestas al
instrumento.
Por el dinamismo que
representa el proceso de aprendizaje el primer caso está expuesto a cambios en
cortas temporadas, midiéndose en muchas ocasiones la estabilidad del instrumento viciada con el dinamismo de
aprendizaje, por lo que no se sugiere realizar estudios de este tipo en
períodos que excedan los tres meses.
En un segundo caso la
condición será similitud de instrumentos (equivalencia),
es decir, que un estudiante deberá obtener calificaciones similares si se le
aplican dos instrumentos de medición formados con la misma cantidad de
preguntas seleccionadas con índices de dificultad y discriminación similares y
con base en una tabla de especificaciones común.
En las ciencias duras los instrumentos tienen suficiente
precisión, habiendo muy poca diferencia entre las mediciones de dos
instrumentos (termómetro, reloj, báscula, etc.). No obstante, las mediciones en
el área educativa difícilmente mantienen una precisión exenta de variabilidad
entre un instrumento y otro, a pesar de los grandes esfuerzos por buscar la
equivalencia.
En el tercer caso la
condición consiste en la relación que guardan cada una de las partes del
instrumento, con el resultado final que se obtiene (consistencia interna). Esto implica la relación que guardan la
calificación total del estudiante con las calificaciones obtenidas en los temas
y las preguntas que integran el instrumento.
La consistencia interna es,
en la mayoría de los casos, la forma más estable de medir la confiabilidad de
un instrumento. Además, un estudio de consistencia interna permite la obtención
automática de la validez teórica, siempre y cuando el universo de conocimientos
esté bien definido y el muestreo de los conocimientos sea representativo. Por
esto y, asumiendo el cuidado requerido en la elaboración de la tabla de especificaciones
y la elaboración de las preguntas que representen el conocimiento en forma
amplia y en la taxonomía requerida, se propone una forma breve de obtención de
la consistencia en el instrumento, incluyendo ambos índices requeridos.
La consistencia interna
como índice de confiabilidad y validez.
![]()
Una de las
formas más usuales consiste en la aplicación de la fórmula KR21, para la cual
debemos explicar otros procedimientos auxiliares por medio de cálculo
simplificado.
Procedimiento para el
cálculo de la consistencia (KR21)
1. Obtenga
2. Réstela del total de
preguntas de la prueba = K-M
3. Multiplique el resultado de
punto 2 por
4. Obtenemos
5. Eleve al cuadrado el
resultado del punto 4 para obtener
6. Multiplicamos el resultado
del punto 5 por el total de preguntas de la prueba = Ks2
7. Dividimos el resultado del
punto 3, entre el resultado del punto 6 = M(K-M)/Ks2
8. Restamos de uno, el
resultado del punto 7 = 1 - M(K-M)/Ks2
![]()
Procedimiento para el
cálculo de
1. Ordene las calificaciones
de mayor a menor
2. Multiplique por 4 la
calificación que ocupe el centro = 4(c)
3. Sume al producto del punto
2 las calificaciones que ocupen el primero (i) y el último lugares (f) = i + 4(c) + f
4. Para obtener
![]()
Procedimiento para el
cálculo de
1. Calcule
2. Calcule
3. Reste
4. Divida el resultado entre
3, s = Ms - Mi / 3
5. Eleve al cuadrado el
resultado del punto 4, s2
= (Ms -
Mi / 3)2
ESTADISTICA DE CALCULO RAPIDO[7]
Elementos
de muestreo
En la cuasivarianza
poblacional, la máxima variabilidad posible se encuentra en la combinación [p =
.5][q = .5], con lo cual se obtendrá la mayor muestra posible. Cuando no se
conoce la cuasivarianza poblacional, o no nos interesa obtenerla, deberá
optarse por la muestra del mayor tamaño.
La muestra obtenida la
podemos dividir en subgrupos o estratos (afijación). Este procedimiento puede
incluir la misma cantidad de casos por estrato (afijación uniforme),
proporcional al número de elementos de cada estrato (afijación proporcional), o
proporcional al número de elementos y a la desviación estándar de cada estrato
(afijación óptima).
Cuando el muestreo es sistemático, tomamos elementos
proporcionales que deberán formar la muestra, de [k] en [k] elementos, a partir
de uno de ellos elegido aleatoriamente entre los que ocupan los lugares primero
y k-ésimo, incluyendo ambos extremos.
Una forma alterna consiste
en la utilización del muestreo en conglomerados,
cambiando la unidad física elemental, por unidades de muestreo que comprendan
un grupo de las primeras. Este procedimiento es factible si las unidades
físicas elementales se encuentran distribuidas en forma aleatoria en cada uno
de los conglomerados, o bien, si utilizamos una afijación uniforme que permita
el balanceo entre las categorías utilizadas.
Los procedimientos
señalados se basan en la homogeneidad de la población de donde extraemos la
muestra. Sin embargo, una forma de generalizar que sea homogénea es la
utilización del proceso aleatorio que lo garantice, lográndose por este hecho
la representatividad de la muestra, no dependiendo del tamaño de ésta, sino del
procedimiento probabilístico utilizado.
El grado de generalización
de los resultados tampoco depende del número de casos, sino que se fundamenta
más fírmemente sobre la base de la replicación, que puede ser directa, cuando
los resultados se verifican contra un grupo similar y con el mismo
procedimiento, o bien, sistemática, cuando varían las características del grupo
original, así como las técnicas empleadas, manteniendo constante sólo el
efecto que queremos medir.
Este procedimiento de
muestreo es generalmente utilizado para estadística descriptiva. Sin embargo,
para procesos de la estadística inferencial se siguen reglas especiales.
El muestreo con reemplazo
permite la utilización de N = 30 como representativos de la población, siempre
y cuando los casos sean seleccionados aleatoriamente. Se ha sugerido que en
modelos de diseño experimental se permitan diez casos aleatorios por categoría
de datos, pudiendo representar los casos varias categorías en algunos modelos
como el factorial o Prueba F. Se ha sugerido también la posibilidad de utilizar
un mínimo de seis casos por categoría cuando se garantiza la normalidad en la
distribución de la población y son seleccionados los casos en forma aleatoria
irrestricta. En cualquier caso, deberán verificarse las restricciones del
modelo a utilizar, incluyendo las escalas de medición aceptadas.
Cuando tenemos N > 30
es difícil que existan datos que se consideren demasiado extremos. Sin embargo,
al tener menos casos es probable que alguno de ellos sea demasiado extremo, no
correspondiendo a la representatividad de muestra, con respecto a la población
estudiada.
DETECCION
DE UN ELEMENTO EXTRAÑO
Es frecuente, en el aula, que en un proceso evaluativo
alguno de los estudiantes tenga una calificación muy alta o muy baja, con
respecto al resto del grupo. En estos casos podemos tener dudas con respecto a
si debemos incluir el dato extremo para realizar nuestros cálculos.
Ejemplo:
1 2
3 4 ...
10?
Procedimiento.
1. Califique los instrumentos de medición.
2. Ordene de menor a mayor las calificaciones.
3. Reste el dato menor del mayor, incluyendo el elemento extraño (10):
D = 10 - 1 = 9
4. Reste el dato menor del mayor, excluyendo el elemento extraño:
d = 4 - 1 = 3
5. Use z = 1.960 para p = .05 y, z = 2.576 para p
= .01 siendo valores de la curva normal. Cuando menos deberá trabajar a p = .05
pudiendo cerrar el valor a z = 2 (ver
anexo 3).
Criterio:
Se excluye el dato si se cumple la fórmula.
E = D > zd
9 : 2(3) = 9 > 6 [Se
rechaza].
Una vez que se garantiza que todos los datos
seleccionados deben ser tomados en cuenta, iniciamos el trabajo propiamente
estadístico.
Aún cuando estos procedimientos ya han sido
aplicados, deseamos incluirlos como parte de esta sección con el objeto de
guardar la congruencia y contingencia de los modelos presentados. Para este
ejercicio tomaremos un grupo de datos ordenándolos de menor a mayor.
13 24
26 29 30 30 31
= 26.667 (cfr. 26.143)
32 34
35 37 38 38 41
41 41
42 42 43 46 47
49 49
50 50 52 53 54
55 56
58 60 61 61 63
63 64
67 69 72
74 77 =
69.333 (cfr. 69.429)
Procedimiento para
1. Divida al grupo en seis subgrupos de igual
cantidad de datos. Si no son iguales, incluya los grupos desiguales en el
centro, buscando la mayor igualación.
2. Tome el valor inicial [i = 13].
3. Tome el valor final [f = 77].
4. Tome cuatro veces el valor central que,
tratándose de un número par de casos, deberá ser el promedio entre los valores
centrales [c = (47+49)/2 = 48].
5. Utilice la fórmula:
![]()
![]()
= 47.000 (cfr. 47.548).
Procedimiento para
1. Tome 1/6 de los datos MENORES y obtenga su
Media (26.667).
2. Tome 1/6 de los datos MAYORES y obtenga su
Media (69.333).
![]()
3. Utilice la fórmula:
![]()
= 14.222 (cfr. 14.938)
NORMALIZACION
DE DATOS
Si ya se obtuvieron
![]()
![]()
![]()
![]()
![]()
![]()
Para el caso particular de calificaciones basadas en normas dentro de
nuestro medio (México), sugerimos el uso de la siguiente fórmula que nos
permite dispersiones entre 5 y 10 puntos:
Si se toma la equis (X) como la calificación de
un sujeto, se le podrá asignar un valor estándar. Además, pueden tomarse todos
los valores posibles de calificación para desarrollar una norma general para el
instrumento de medición.
CORRELACION
ENTRE DOS GRUPOS
En alguna ocasión estaremos interesados en
verificar si los estudiantes que obtienen mejores calificaciones en nuestra
materia, también obtendrán las mejores calificaciones en otra materia y
viceversa. Si tenemos dos series de datos y queremos comprobar si existe una
relación entre ellas, podemos aplicar la fórmula: [8]
![]()
Ejemplo:
|
Casos |
Gpo. A |
Gpo. B |
A:mA |
B:mB |
Datos |
|
1 |
13 |
22 |
- |
- |
1 |
|
2
|
15 |
23 |
- |
- |
1 |
|
3 |
15 |
24 |
- |
- |
1 |
|
4
|
16 |
25 |
- |
+ |
0 |
|
5
|
17 |
25 |
+ |
+ |
1 |
|
6
|
17 |
25 |
+ |
+ |
1 |
|
7
|
17 |
26 |
+ |
+ |
1 |
|
8
|
17 |
25 |
+ |
+ |
1 |
|
9
|
17 |
23 |
+ |
- |
0 |
|
10 |
18 |
26 |
+ |
+ |
1 |
|
11 |
18 |
26 |
+ |
+ |
1 |
|
Medias |
16.18 |
24.55 |
|
|
9 |
Procedimiento.
1. Obtenga
2. Compare cada uno de los datos con
3. Cuente el número de pares en los cuales ambos
casos son del mismo símbolo, sean (+) o (-) [Iguales = 9].
4. Cuente el número de pares en los que los símbolos sean diferentes
[Diferentes = 2].
5. Obtenga la diferencia y la suma entre pares que se toman en cuenta:
D = 9 - 2 = 7
N = 9 + 2 = 11
6. Use
la fórmula.
![]()
![]()
= 7 > 6.6
[Se acepta].
Conclusión: Existe
una relación significativa entre las calificaciones del grupo A y el grupo B,
indicando que la calidad de los alumnos es consistente en las calificaciones de
ambas materias.
DIFERENCIA
ENTRE DOS MUESTRAS
Puede ser que, en algún caso especial, estemos
interesados en saber si entre una evaluación diagnóstica y una sumaria nuestro
alumnos obtuvieron un incremento significativo en los conocimientos de nuestra
materia. En esta ocasión estamos utilizando a los mismos alumnos antes y
después de un proceso educativo (muestras relacionadas).
En frecuente que estemos interesados en comparar si el
método que estamos utilizando es mejor o peor que el método que utiliza algún
profesor compañero nuestro para impartir la misma materia. En este caso
estaremos utilizando estudiantes diferentes para comparar nuestros métodos
(muestras independientes).
Ejemplo para ambos casos de diferencias entre
Medias:
|
Casos |
Gpo. A |
Gpo. B |
Dif. |
Dif. |
|
1 |
9.8 |
9.5 |
0 |
1 |
|
2 |
8.1 |
8.2 |
1 |
0 |
|
3 |
7.9 |
8.6 |
1 |
1 |
|
4 |
9.5 |
9.7 |
1 |
1 |
|
5 |
8.4 |
8.7 |
1 |
1 |
|
6 |
7.2 |
7.4 |
1 |
0 |
|
7 |
9.1 |
9.3 |
1 |
1 |
|
8 |
8.5 |
8.1 |
0 |
0 |
|
9 |
7.1 |
7.6 |
1 |
0 |
|
10 |
9.5 |
9.7 |
1 |
1 |
|
11 |
9.2 |
9.5 |
1 |
1 |
|
|
|
8.57 |
9 |
7 |
RELACIONADAS [1]
![]()
Los modelos de muestras relacionadas se usan cuando se realiza un
estudio con los mismos casos, “antes” y “después" de un evento, o cuando
se utilizan casos equivalentes en la variable a medir y se aplica un
tratamiento a un grupo (experimental), comparándolo con el otro grupo (control)
para medir el efecto. En este caso podemos utilizar la fórmula:
Procedimiento.
1. Compare uno a uno todos los pares de casos,
escribiendo un (1) si el grupo experimental (o el valor posterior), es más
grande que el del control (o valor anterior). Escriba un (0), si es menor, en
los mismos casos. Si son iguales no se toman en cuenta.
2. Cuente cuántos casos tienen (1) y cuántos
tienen (0), comparando las frecuencias.
D = 9 - 2 = 7
N = 9 + 2 = 11
3. Use la fórmula.
![]()
![]()
= 7 > 6.6
[Se acepta].
Conclusión: Existe una diferencia significativa
entre las calificaciones del grupo A y el grupo B, es decir, hemos logrado un
cambio significativo mediante la instrucción que les impartimos a nuestros
alumnos.
INDEPENDIENTES [2]
Supongamos, en comparación al ejemplo anterior,
que los datos están seleccionados en forma independiente y queremos ver si el
grupo B difiere del grupo A. Tomando los datos del ejemplo anterior, tenemos:
Procedimiento.
1. Obtenga
2. Compare cada uno de los datos del grupo
experimental (B), con
3. Cuente cuántos casos tienen (1) y cuántos tienen (0), comparando las
frecuencias:
D = 9 - 2 = 7
N = 9 + 2 = 11
4. Use la fórmula.
3. Use la fórmula.
![]()
![]()
= 7 > 6.6
[Se acepta].
Conclusión: Existe una diferencia significativa entre las
calificaciones del grupo A y el grupo B, es decir, uno de los métodos aplicados
es mejor que el otro, debiéndose verificar cuál de los dos grupos obtiene
mejores calificaciones para saber cuál es el mejor método.
DIFERENCIA
ENTRE VARIAS MUESTRAS
Para este caso se utiliza el procedimiento para
detectar un elemento extraño, pero los datos que se toman en cuenta se refieren
a las Medias de los grupos, en vez de los datos originales.
Si no se cumple la fórmula deberá concluir que
todos los grupos son similares entre sus Medias, siendo necesario que la
fórmula no se cumpla para determinar si alguna de las Medias es demasiado
extrema con respecto a las demás.
TENDENCIA
DE UNA SERIE DE DATOS
Otro caso frecuente consiste en aplicar un curso
remedial a los alumnos que están obteniendo calificaciones bajas con respecto
al grupo. Podemos obtener las calificaciones que han obtenido antes de ser
incluidos en el curso y, posteriormente verificar si las calificaciones varían
con respecto a la calificación inicial.
Si observamos la tendencia de una serie de
datos y queremos verificar si existe un incremento o decremento significativo
usamos este modelo.
Ejemplo:
a) 7.9
7.6 7.5 7.9
8.3 Semimedia (a) 7.84
b) 8.3
8.5 8.9 8.7
9.6
c) 9.3
9.7 8.5 9.8 10.0 Semimedia (b)
~~~~
Dif. = 1.62
1 1 1
1 1 a favor de (c) = 5
0 0 0
0 0 a favor de (a) = 0
Procedimiento (a). Cálculo de significación.
1. Tome los datos secuenciales (sin ordenarlos) y
divídalos en tres grupos. Puede igualar los datos extremos disminuyendo o
aumentando un dato al grupo central, en caso de no ser exactamente divisibles
entre tres.
2. Compare cada uno de los datos del tercer grupo,
con el dato relativo en el primer grupo, anotando (1) si es favorable al
tercero y un (0) si es favorable al primero.
3. Utilice
la fórmula:
![]()
![]()
= 5 > 4.47 [Se acepta].
Procedimiento (b). Cálculo de valores de predicción.
4. Obtenga
las semimedias de los grupos extremos.
5. Obtenga la diferencia entre las semimedias.
6. Cuente los espacios existentes entre las
semimedias (desde 7.5 hasta 8.5) [10 espacios].
![]()
7. El valor de la constante es la
diferencia entre semimedias, dividida por el número de espacios:
= 0.162
8. Este valor se restará de la primera semimedia
para obtener los datos predictivos anteriores a ésta y se le sumará para
obtener los datos predictivos posteriores, pudiéndose verificar la predicción
al coincidir con el valor de la segunda semimedia.
Valores de predicción.
a) 7.516 7.678
7.840*
1 8.002 2
8.164 3
b) 8.326 4
8.488 5
8.650 6
8.812 7
8.974 8
c) 9.136 9
9.298 10 9.460*
9.622 9.784
Por medio de este procedimiento doble no sólo sabremos
si es significativa la tendencia ascendente o descendente de los datos, sino
que podremos predecir el comportamiento medio de esta tendencia, de acuerdo con
una línea recta[9].
Conclusión: La tendencia es
significativa, con un valor de 0.162 como constante ascendente, es decir, el
curso remedial ha tenido éxito.
BIBLIOGRAFIA
Armstrong, R. J., et. al. (1973): Desarrollo y evaluación de objetivos de
conducta. Buenos Aires: Guadalupe.
Bean,
K. L. (1953): Construction of
educational and personel tests. New York: McGraw-Hill.
Bloom, B. S., Hastings, J. T. & Madaus, G.
F. (1977): Evaluación del aprendizaje.
Buenos Aires: Troquel.
Bloom, B. et al. (1990): Taxonomía de los
objectives de la educación: Clasificación de las metas educacionales.
Buenos Aires: El Ateneo.
Campbell,
D. T. (1960): Recomendations for APA tests standards regarding construct,
trait, or discriminant validity. Amer. Psychologist 15: 546.
Carreño H., F. (1981): Enfoques y principios teóricos de la evaluación. México: Trillas.
Committee
on Test Standards, American Educational
Research Association, National Education Association, y National Council on
Measurements Used in Education. (1955): Technical
recommendations for achievement
tests. Washington: The National
Education Association.
Cortada
de K., N. (1968): Manual para la
contrucción de tests objetivos de
rendimiento. Buenos Aires: Paidós.
Cronbach,
L. J. (1960): Essentials of
psychological testing. New York: Harper & Row.
Cronbach,
L. J. & Meehl, P. E. Construct
validity in psychological tests. En C. I. Chase & Lidlow, H. G. [eds.] (1966): Readings in educational
and psychological measurement. Boston: Houghton Miffing.
Diederich,
P. B. (1964): Short-cut statistics for
teacher-made tests. New Jersey: Educational Testing Service.
Dixon,
W. J. & Massey, F. J. (1969) Introduction
to statistical analysis. New York: McGraw-Hill.
Downie,
N. M. (1967): Fundamentales of
measurement: Techniques and practices. New York: Oxford University Press.
Ebel,
R. L. (1965): Measuring educational
achievement. New Jersey: Prentice-Hall
Fermín,
M. (1992): La evaluación, los exámenes y
las calificaciones. Buenos Aires: Kapelusz.
Federal
Electric Corporation. (1967): PERT. New
York: John Wiley & Sons.
Ferguson,
G. A. (1959): Statistical analysis in
psychology and education. New York: McGraw-Hill.
Finney,
D. J. (1960): Exerimental design and its
statistical basis. Chicago: The University of Chicago Press.
Furst, E. J. (1958): Constucting evaluation instruments. New York: Longmans & Green.
Gagné, R. M. (1970): Las condiciones del aprendizaje. Madrid: Aguilar.
Gagné,
R. M. (1973): Domains of learning. Interchange.
3: 3.
Glass,
G. V. & Stanley, J. C. (1969): Statistical
methods in education and psychology. Englewood Cliffs: Prentice Hall.
Goring, P. A. (1971): Manual de mediciones y evaluación del rendimiento en los estudios.
Buenos Aires: Kapelusz.
Gronlund,
N. E. (1982): Elaboración de tests de
aprovechamiento. México:
Trillas.
Gulliksen,
H. (1950): Theory of mental tests. New
York: Wiley.
Haber,
A. & Runyon, R. P. (1973): Estadística
general. México: Fondo Educativo Interamericano.
Hays,
W. L. (1963): Statistics. New York:
Holt, Rinehart & Winston.
Howitt,
L. C. (1968): Pruebas prácticas en el
aula. México: Uteha.
Karmel,
L. J. (1981): Medición y evaluación
escolar. México:
Trillas.
Katz,
M. (1961): Selecting an achievement
test: Principles and procedures. New Jersey: Educational Testing Service.
Kuder,
G. F. & Richardson, M. W. (1937): The theory of the estimation of test
reliability. Psychometrika. 2: 151.
Lafourcade,
P. D. (1969): Evaluación de los
aprendizajes. Buenos Aires: Kapelusz.
Lawshe,
C. H. (1953): Pruebas psicotécnicas en
la selección de personal. Madrid:
Rialp.
Linderman,
R. (1971): Tratado de medición
educacional. Buenos Aires: Paidós.
Linquist,
E. F. [de.] (1951): Educational measurement. Washington:
American Council on Education.
Linquist,
E. F. (1953): Statistical analysis in
educational research. Boston: Houghton Mifflin.
Lord,
F. M. & Norvick, M. R. (1968): Statistical
theories of mental test scores. Reading:
Addison-Wesley.
Mager, R. F. (1962): Preparing instructional objectives. San Francisco: Fearon
Publishers.
Magnusson,
D. (1969): Teoría de los tests. México: Trillas.
Meehal,
P. E. (1967): Theory-testing in psychology and physics: a methodological
paradox. Philosophy of science.
Miller,
H. G. & Reed, W. (1973): Constructing higher level multichoice questions
covering factual content. Educational Technology. 13(5): 39.
Morse,
H. T. & McCune, G. M. (1964): Selected
items for the testing of study
skills and critical thinking. Washington: National Council for the Social
Studies.
Outon
M., J. A. (1982): De los exámenes.
Boletín del Centro de Didáctica
de la Universidad Iberoamericana (DIDAC).
México: UIA.
Quenouille,
M. H. (1972): Rapid statistical
calculations. Londres:
Griffin.
Robinson,
J. P. & Shaver, P. R. (1969): Measures
of social psychological attitudes. Ann Arbor, Mich.: Survey Research Center,
University of Michigan.
Rodríguez
C., H. M. & García G., E. (1982): Evaluación
en el aula. México:
Trillas.
Spiegel,
M. R. (1961): Statistics. New York:
McGraw-Hill.
Stanley,
J. C. (1964): Measurement in today's
schools. Englewood Cliffs: Prentice Hall.
Stufflebeam, D. L. & Shinkfield, A. J.
(1993): Evaluación sistemática. Guía
teórica y práctica. Barcelona: Paidós.
Travers, R. M. (1959): How to make achievement tests. New York: The Odyssey Press.
Tuckman,
B. W. (1979): Evaluating instructional
programs. Boston: Allyn & Bacon.
Tuckman,
B. W. (1975b) Measuring educational
outcomes (Fundamentals of testing). New York: Harcourt Brace
Javanovich.
ANEXO I
Taxonomías Educativas
TAXONOMÍAS EDUCATIVAS
Del griego taxis (ordenamiento) y nomo (norma). La taxonomía es un tipo de
nomenclatura que permite la clasificación de las especies en la historia
natural comenzó a utilizarse gracias al naturalista Carl Von Lineé a mediados
de 1700. Se denomina taxón a la unidad sistemática como familia, género y
especie, cada grupo taxonómico recibe un nombre científico en latín. Es para el
caso de los animales un método universal de la clasificación.
Las
principales aportaciones a la taxonomía son de Aristóteles a la clasificación
biológica. Los estudios taxonómicos desde la Edad Media hasta el siglo XVIII.
Los aportes de Linneo y otros taxónomos destacados de los siglos XVIII y XIX.
En el caso de la
educación Benjamín Bloom[10]
y sus colaboradores han sido los principales defensores de la aplicación de los
estudios taxonómicos al campo de las ciencias de la educación, con objeto de
jerarquizar de algún modo los objetivos educativos en la integración del
aprendizaje. La taxonomía educativa es una clasificación jerárquica de los
niveles de desarrollo humano en el dominio determinado del conocimiento.
El uso de una
taxonomía, como la de Bloom, sirven y ayudan en la verificación del nivel en el
que se logran los objetivos de aprendizaje enfocados a objetivos más
específicos u operativos medios a través de los reactivos de opción múltiple.
El manejo
estricto de la programación por objetivos lleva a un manejo lineal del
aprendizaje
Cuando se quiere medir el aprendizaje, éste requiere de un proceso
sistemático, por lo tanto hay una ruta a seguir en la cual se pueden
entrecruzar diferentes momentos de este proceso, pero que tienen una meta en
común; estamos hablando de la definición de objetivos de aprendizaje los cuales
tienen que tener una especificación meticulosa y pertinente lo que nos dará
como resultado un plan preconcebido de las prueba con congruencia en los
niveles de conocimiento.
El diseño de este
plan se llama TABLA DE ESPECIFICACIONES
(ver pág.), más adelante hablaremos de este proceso, esta tabla define los
contenidos a medir seguido de amplias categorías que pueden ser subdivididas de
acuerdo con la
naturaleza de la
instrucción y la complejidad de sus finalidades, para asegurarnos que el campo
ha sido adecuadamente considerado en el lugar exacto, tanto en el contenido,
como en el tipo de conducta que se deberá utilizar.
Los resultados
del aprendizaje que se vaciarán en esa tabla deberán reflejar fielmente los
objetivos de la enseñanza del curso y para lograr esta meta necesitamos conocer
los niveles taxonómicos, para saber qué nivel de amplitud y complejidad
queremos al medir de los conocimientos adquiridos, es decir ver si se alcanzaron
los objetivos de aprendizaje.
Una forma
apropiada de hacer un plan detallado del examen o tabla de especificaciones
consiste en redactar por cada unidad temática) o por aspectos del perfil
referencial de validez una serie de conductas específicas que se aceptarán como
evidencia de que se han logrado los resultados de aprendizaje propuestos, el
nivel de profundidad deseado. Para elaborar esta tabla de especificaciones se
deben clasificar los resultados de aprendizaje de acuerdo a la taxonomía de
Bloom, es la más conocida y de la cual se basan otras taxonomías, su uso
garantiza un amplio conocimiento
Bloom edifica estas clasificaciones sobre la base de los siguientes
principios:
A.
Principio didáctico.
Las taxonomía deben apoyarse sobre los grandes haces de objetivos perseguidos
en el proceso de enseñanza.
B.
Principios psicológicos.
Deben corresponder en todo lo posible a nuestro saber en materias de psicología
del aprendizaje, sin oponerse en ningún caso a los principios admitidos como
válidos
C.
Principio lógico. Las categorías
deben articularse lógicamente.
D.
Principio objetivo. La
jerarquía de los objetivos no corresponde a una jerarquía de valores.
E.
Principio estructural.
(Complejidad creciente). Este aumento de la complejidad parece acompañarse de
un aumento en la dificultad de enseñanza y aprendizaje”.
La clasificación
a la cual nos avocaremos es únicamente a la de PRINCIPIOS OBJETIVOS, la cual se
compone de la siguiente jerarquía de objetivos para la educación:
|
|
|
|
|
|
4.
ANÁLISIS |
|
|
|
|
|
|
5.
SÍNTESIS |
|
|
|
|
|
|
6.
EVALUACIÓN |
Los seis niveles
taxonómicos no son excluyentes, cada uno depende del otro si hablamos de
comprensión necesariamente requerimos de conocimientos, pero si nos referimos a
conocimientos de aplicación previamente se requieren de conocimientos,
comprensión y aplicación.
Los conocimientos van de
forma ascendente de lo más fácil a lo más difícil; por ejemplo cuando en la
primaria nos enseñan a contar y posteriormente a sumar y restar nos enseñan de
una forma empírica al decirnos lo siguiente: “Juanito tiene cinco manzanas pero
le regalan dos más cuántas tiene ahora, la respuesta es siete manzanas, pero
después Juanito se come una manzana, cuántas le quedan la respuesta es seis
manzanas, nos dan una definición del conocimiento sobre la suma y la resta, así
también cuando nos enseñan una recta donde si la ranita salta para adelante
está sumando, pero si la ranita va para atrás esto significa que está restando.
Lo anterior es un conocimiento de número, suma y resta., pero a la vez se
interpreta lo que significa el sumar y restar y lo traducimos en operaciones
más formales. La situación aumenta en complejidad cuando Juanito debe aplicar
sus conocimientos y saber qué cantidad tiene de manzanas cuando ocho personas le
regalan seis manzanas cada y esto aumenta las que tenía, así que si tenía seis
manzanas por ocho personas son 48 manzanas, más las 6 que tenía suman 54
manzanas, estas 54 manzanas las debe dividir entre él y cinco amigos, para
llegar al resultado final tendrá que saber sumar, restar, multiplicar y dividir
para saber que les tocará a cada uno nueve manzanas.
El ejemplo
anterior es para aclarar que los niveles taxonómicos no son independientes uno
del otro, Juanito debe tener el conocimiento de número, pero también comprender
e interpretar la suma y resta, además de que para dividir requiere de las
operaciones anteriores.
Cuando un maestro
enseña, generalmente hace preguntas para comprobar si los estudiantes han
aprendido la información que se les ha presentado. Todas las preguntas pueden
ser clasificadas de acuerdo a su dificultad usando la taxonomía cognoscitiva de
Bloom. Existen seis niveles de taxonomía, que van desde el más simple que es
Conocimientos hasta el más complejo evaluación. Los diseñadores de exámenes
deben buscar que las preguntas que formulen reflejen los diversos niveles
taxonómicos. El adaptar las preguntas a diferentes niveles demuestra un nivel
superior.
Además de
trabajos de Bloom en este sentido se han desarrollado, en una tarea todavía no
concluida, multiplicidad de estudios taxonómicos de los objetivos educativos,
entre los que cabe reseñar los siguientes:
a)
En el dominio cognoscitivo, las taxonomías de Tyler
(1934), Guilford, siguiendo un modelo tridimensional con base en las operaciones
de inteligencia, los contenidos y los productos, D’Hainaut (1970), Gronlund
(1970), Sullivan (1969), Vandevelde (1975), Gagné, basada en lo que denomina
“campos de aprendizaje”, de gran similitud con la de Bloom, entre otras, y la
de De Block (1970).
b)
En el dominio afectivo son conocidas las de
Krathwohl y colaboradores (1964), Gronlund (1970), Smith (1970), Williams
(1967), y French (1957), entre otras.
c)
En el dominio psicomotor, las de Simpson (1966),
Dave (1969) Moore (1967), Bruner (1973), Cratty (1970), Guilford (1958), Magre
y Destrooper (1973), Wintrebert (1964), Vayer (1971), Harrow (1972), Kibler,
Barker y Miles (1970) y Álvarez Manilla.[11]
A parte de estos tres
grupos de estudiantes acerca de las taxonomías, han existido inventos de
integración de los tres dominios, Scriven y Tuckman (1970), y de la adaptación
de las existentes a las distintas áreas de estudio o de la ciencia, colmo la de
Gagné, aplicada a las ciencias de la naturaleza, y especialmente la de
Leonedelsky , la de
Klopfer, para las ciencias; Wilson, para las matemáticas, y Orlandi , aplicada
a los estudios sociales.
Nivel taxonómico
|
Descripción: Las
habilidades que se deben demostrar en este nivel son: |
Qué hace el estudiante |
Ejemplos de palabras Indicadoras |
|
CONOCIMIENTO Recoger
información |
Observación y
recordación de información; conocimiento de fechas, eventos, lugares;
conocimiento de las ideas principales; dominio de la materia |
El estudiante recuerda y reconoce información e ideas además de
principios, en la misma forma en que
los aprendió. |
Definir,
listar, rotular, nombrar, identificar, repetir, quién, qué, cuándo, dónde,
describir, recoger, examinar, tabular, citar. |
|
COMPRENSIÓN Confirmación
aplicación |
Entender la
información; captar el significado; trasladar el conocimiento a nuevos
contextos; interpretar hechos; comparar, contrastar; ordenar, agrupar;
inferir las causas predecir las consecuencias |
El estudiante
esclarece, comprende, o interpreta información con base a conocimiento previo |
Predecir,
asociar, estimar, diferenciar, extender, resumir, describir, interpretar,
discutir, extender, contrastar, distinguir, explicar, parafrasear, ilustrar,
comparar |
|
APLICACIÓN Hacer uso del
conocimiento |
Hacer uso de la
información; utilizar métodos, conceptos, teorías, en situaciones nuevas;
solucionar problemas usando habilidades o conocimientos |
El estudiante
selecciona, transfiere, y utiliza datos y principios para completar una tarea
o solucionar un problema |
Aplicar,
demostrar, completar, ilustrar, mostrar, examinar, modificar, relatar,
cambiar, clasificar, experimentar, descubrir, usar, computar, resolver,
construir, calcular |
|
ANÁLISIS (Orden
Superior) dividir, desglosar |
Encontrar
patrones; organizar las partes; reconocer significados ocultos; identificar
componentes |
El estudiante
diferencia, clasifica, y relaciona las conjeturas, hipótesis, evidencias, o
estructuras de una pregunta o aseveración |
Separar,
ordenar, explicar, conectar, dividir, comparar, seleccionar, explicar,
inferir, arreglar, clasificar, analizar, categorizar, comparar, contrastar |
|
SÍNTESIS (Orden
superior) reunir, incorporar |
Utilizar ideas
viejas para crear otras nuevas; generalizar a partir de datos suministrados;
relacionar conocimiento de áreas diversas; predecir conclusiones derivadas |
El estudiante
genera, integra y combina ideas en un producto, plan o propuesta nuevos para
él o ella |
Combinar,
integrar, reordenar, sustituir, planear, crear, diseñar inventar, que pasa
si?, preparar, generalizar, componer, modificar, diseñar, plantear hipótesis,
inventar, desarrollar, formular, rescribir |
|
EVALUAR (Orden
Superior) Juzgar el resultado |
Comparar y
discriminar entre ideas; dar valor a la presentación de teorías; escoger
basándose en argumentos razonados; verificar el valor de la evidencia;
reconocer la subjetividad |
El estudiante
valora, evalúa o critica en base a estándares y criterios específicos. |
Decidir,
establecer desarrollar, probar, medir, recomendar, juzgar, explicar,
comparar, sumar, valorar, criticar, justificar, discriminar, apoyar,
convencer, concluir, seleccionar, establecer rangos, predecir, argumentar |
1.00 CONOCIMIENTO (Retención del material previamente aprendido)
1.10 Conocimiento específicos
1.11
Conocimiento de los
términos
1.12
Conocimiento de hechos
específicos
1.20 Conocimiento
de modos y medios [relacionados] con casos específicos
1.21
Conocimiento de
convenciones
1.22
Conocimiento de
tendencias y secuencias
1.23
Conocimiento de
clasificación y categorías
1.24
Conocimiento de criterios
1.25
Conocimiento de
metodologías
1.30
Conocimiento de
universales y abstracciones de un área
1.31
Conocimiento de
principios y generalizaciones
1.32
Conocimientos de teorías
y estructuras
2.00 COMPRENSIÓN (Entendimiento del significado del material)
2.10
Traducción (Convertir una forma en otra)
2.20
Interpretación (Explicar o resumir el material con sus
propias palabras)
2.30 Extrapolación (Extender el significado más allá de los
datos)
3.00
APLICACIÓN (Uso de la información en situaciones
concretas)
4.00
ANÁLISIS (Dividir el material en sus partes)
4.10 Análisis
de elementos (Identificar las partes)
4.20 Análisis
de relaciones (Identificar las relaciones)
4.30 Análisis
de los principios organizadores (Identificar la forma en que están organizadas
las partes)
5.00
SÍNTESIS (Integrar las partes en un todo)
5.10 Elaborar una sola comunicación
5.20 Elaborar
un plan o un conjunto propuesto de operaciones
5.30 Deducir
un conjunto de relaciones abstractas
6.00
EVALUACIÓN (Juzgar el valor de una
cosa para determinado propósito, empleando criterios definidos)
6.10 Juicios en función de evidencias subjetivas
6.20 Juicios en función de criterios objetivos[12]
Supone evocación
(recuerdos) de información específicas y universales de métodos y procesos , de
estructura y modelos. Da mayor énfasis a los procesos psicológicos del
recuerdos y relación, implicando organización y reorganización de un problema,
para que prevea los signos y claves útiles para la información y conocimientos
ya poseídos por el que responde.
Este
tipo de conocimiento se refieren a información específica y aislada. Enfatiza
símbolos con referencias concretas, con un bajo nivel de abstracción, por lo
tanto se puede considerar constituido por elementos de los cuales se deducen
formas más complejas y abstractas del conocimiento.
1.11
CONOCIMIENTO DE LOS TÉRMINOS
Conocimientos
con referencias para símbolos específicos que pueden incluir los más aceptados
generalmente, variedades que pueden utilizarse para un asola referencia o el de
la referencia apropiada para el uso de determinados símbolos.
§
Definición de
términos técnicos mediante sus atributos, propiedades o relaciones.
§
Familiaridad con
extenso número de palabra en sus significado comunes.
1.12
CONOCIMIENTO DE HECHOS ESPECÍFICOS
Pueden
incluir informaciones muy determinadas y específicas, tales como fechas
precisas o la magnitud de un fenómeno, además de información relativa o
aproximada.
§
Evocación de
sucesos importantes acerca de determinadas cultural
§
Posesión de conocimientos
mínimos acerca de los organismos estudiados en el laboratorio.
1.20 CONOCIMIENTO DE MODOS Y
MEDIOS RELACIONADO CON COSAS ESPECÍFICAS
Se refiere a la forma de organizar, estudiar, juzgar y criticar,
incluyendo tanto los métodos para investigar, secuencias cronológicas y normas
de juicio en determinada área, como los modelos de organización mediante los
cuales las áreas del campo de acción de determinan y organizan internamente.
Constituye un nivel de abstracción intermedio entre usar este material, sino
más bien exige una concepción pasiva de su naturaleza.
1.21 CONOCIMIENTO DE CONVENCIONES
Conocer
formas características de tratar y presentar las ideas y fenómenos con
propósitos de comunicación y consistencia. Los que trabajan en determinado
campo emplean estilos, prácticas y formas que sirven mejor a sus propósitos.
Debe reconocerse que, aunque esas formas y convenciones pueden fijarse
arbitrariamente, en forma accidental o basándose en la autoridad, se mantienen
debido al acuerdo general de las personas vinculadas con el tema, fenómeno o
problema.
§
Familiaridad con la forma y convenciones de obra de
arte, versos y papeles científicos.
§
Reconocimiento de expresiones correctas en el
lenguaje oral y escrito.
1.22 CONOCIMIENTO DE TENDENCIAS Y SECUENCIAS
Procesos,
direcciones o movimientos de los fenómenos con relación a un tiempo.
§
Comprensión de la continuidad y desarrollo de la
cultura en sus manifestaciones en la vida americana.
§
Conocimiento de los principios en que se basa el
desarrollo de los programas de servicio de ayuda pública.
1.23 CONOCIMIENTO DE CLASIFICACIÓN Y CATEGORÍAS
Conocimientos
de las clases, grupos, divisiones y arreglos que se consideran fundamentales en
determinada materia, propósito, argumento o problema.
§
Reconocimiento del área delimitada por varias
clases de problemas o materiales.
§
Familiaridad con la clasificación de diversos tipos
de literatura.
1.24 CONOCIMIENTOS DE CRITERIOS
Criterios
mediante los cuales se juzgan o comprueban hechos, principios, opiniones y
tipos de conducta.
§
Familiaridad con criterios de juicio apropiados al
tipo de trabajo y al propósito para el cual éste se lee.
§
Conocimientos de criterios para evaluación de
actividades recreativas.
1.25 CONOCIMIENTOS DE LA METODOLOGÍA
Conocimientos
métodos de investigación, técnicas y procedimientos utilizados en determinado
campo y los empleados en investigaciones de problemas y fenómenos particulares.
Aquí el énfasis se encuentra en el conocimiento del método, más bien que en
habilidades para utilizarlo.
§
Conocimiento del método científico para la
evaluación de la salud, se deben conocer los métodos apropiados para la
solución de problemas sociales.
1.30 CONOCIMIENTOS UNIVERSALES Y ABSTRACCIÓN DE UN
ÁREA
Conocer planes y
modelos según los cuales se organizan los fenómenos e ideas. Incluye las
grandes estructuras, teorías y generalizaciones que dominan ciertas materias o
que se utilizan generalmente para estudiar los fenómenos o resolver los
problemas. Constituye un nivel de abstracción elevado y complejo.
1.31 CONOCIMIENTO DE PRINCIPIOS Y GENERALIZACIONES
Abstracciones
particulares que resumen las observaciones del fenómeno, útiles para explicar,
describir, predecir o determinar las acciones más relevantes y apropiadas o la
dirección que deberá seguirse.
§
Principios importantes por medio de los cuales se
resume nuestras experiencias con los fenómenos biológicos.
§
Evocación de generalizaciones importantes acerca de
ciertas culturas.
1.32 CONOCIMIENTOS DE TEORÍAS Y ESTRUCTURAS
Conjunto de principios y
generalización, así como sus interrelaciones, los que presentan un aspecto
claro y sistemático de un fenómeno, problema o materia compleja. Constituyen
las formulaciones más abstractas y pueden utilizarse para mostrar la
organización de una amplia variedad de conocimientos específicos.
2.00
NIVEL
TAXONÓMICO DE COMPRENSIÓN
Las medidas de
los preguntas de comprensión se aplican a los grados más bajos del
entendimiento. Pueden ayudar a determinar si el sujeto a comprendido el
significado del material, sin pedirle que lo aplique, lo analice, o lo
relacione con otros materiales; se pretende que el sujeto:
2.10
TRADUCCIÓN (identificar el significado de un término)
Traduzca
el material de una forma u otra, esta tarea es la más simple.
|
1. |
|
¿Cuál de los
siguientes términos tiene un significado más parecido al del término
taxonomía? |
|
|
|
A)
Clasificación* B)
Elaboración C)
Evaluación D)
Traducción |
|
2. |
|
¿Cuál de los
siguientes enunciados de verdadero-falso contienen un determinante
específico? |
|
|
|
A)
América es un continente B)
América fue descubierta en 1942 C)
América
tiene varias grandes industrias* D)
La población de América va en aumento |
2.20 INTERPRETACIÓN (capacidad para comprender una idea y explicar
fenómenos).
Interprete
el significado del materia, lo cual incluye de cierta manera tanto el nivel
anterior como el posterior (traducir y extrapolar)
|
1. |
|
El enunciado
“la confiabilidad de un examen es condición necesaria pero no suficiente de
su validez” significa que un examen: |
|
|
|
A)
confiable tendrá cierto grado de validez B)
válido
tendrá cierto grado de confiabilidad* C)
confiable puede ser inválido D)
válido puede ser poco confiable |
|
|
|
Si un examen de verdadero-falso se va a reemplazar por uno de opción
múltiple, se necesitarán más pregunta para mantener: |
|
|
|
A)
la
misma confiabilidad* B)
el mismo grado de dificultad C)
el grado en que se cubre el contenido de la
materia D)
un número mayor de enunciados verdaderos que
falsos |
2.30 EXTRAPOLACIÓN (capacidad para predecir el efecto más probable de una acción).
Extrapole
que se extienda más allá de los datos presentados, siendo esta la tarea más
compleja.
|
|
|
¿Qué es lo más
probable que suceda con la confiabilidad de las calificaciones de un examen
de opción múltiple, cuando el número de opciones de una pregunta se cambia de
cuatro a cinco? |
|
|
|
A)
Aumentan* B)
Disminuyen C)
Se perfecciona D)
Permanecen igual |
Las preguntas de
interpretación y extrapolación se miden
de manera más sencilla con preguntas complejas, lo que es posible hacer
con una serie de preguntas en un párrafo, tabla, mapa, gráfica o croquis dados.
Las preguntas de
aplicación miden también el entendimiento, pero a un nivel más alto, es decir
no solamente se tiene que demostrar que se ha comprendido el significado de la
información sino también aplicarlo a situaciones concretas y nuevas para él.
Puede transferir su aprendizaje y utilizarlo efectivamente en la solución de
problemas nuevos. Las preguntas de aplicación pueden exigir varios aspectos del
conocimiento, como hechos, principios, reglas, métodos y teorías. Tantos las
preguntas de comprensión como las de aplicación pueden aplicarse prácticamente
en todos las áreas del contenido de la materia, de esta manera se proporciona
elementos y formas para medir el entendimiento.
§
Capacidad para reconocer ejemplos de resultados del
aprendizaje enunciados adecuadamente (aplicación de hechos y principios).
§
Capacidad para mejorar las preguntas (aplicación de
las reglas del procedimiento)
|
|
|
Encerrando en
un círculo la S para sí y la N para no, indique cuál de los siguientes
resultados está adecuadamente enunciado en términos conductuales. El
estudiante: |
|
|
|
S *N
aprende los objetivos de los exámenes de aprovechamiento |
|
|
|
S *N
termina por apreciar los exámenes objetivos |
|
|
|
*S
N explica las ventajas de
usar una tabla de especificaciones |
|
|
|
*S
N identifica errores en las
preguntas |
Lea la siguiente
pregunta e indique la menara preferible de mejorarlo.
|
|
¿Cuál de los siguientes tipos de resultados del
aprendizaje es más difícil de evaluar objetivamente? A)
Un concepto B)
Una aplicación C)
Una idea D)
Ninguna de las anteriores |
El mejor cambio
que se le puede hacer a la pregunta es:
A)
cambiar
el pie por la forma de enunciado incompleto
B)
usar
letras en lugar de números en cada opción
C)
quitar
los artículos indefinidos “un” y “una” de las opciones
D)
remplazar
“ninguna de las anteriores” por una interpretación*
Cuando se elaboren
preguntas de este nivel de complejidad se busca que las situaciones que se le
presenten al estudiante no se las hayan encontrado antes y que no se puedan
resolver con base solamente en un conocimiento general. La pregunta se debe
elaborar de suerte que requiera la aplicación de hechos, principios o
procedimientos particulares indicados en el resultado el aprendizaje.
En este nivel
taxonómico hay que separar el material en sus partes componentes y esto
incluye:
§
Identificación de las partes (análisis de los
elementos).
§
Identificación de las relaciones entre las partes
(análisis de las relaciones).
§
Identificación de la forma como están organizados
los elementos (análisis de los principios).
4.10
EL ANÁLISIS DE LOS ELEMENTOS,
abarca capacidades como reconocer suposiciones tácitas, distinguir entre
enunciados de hechos y de opiniones y distinguir las conclusiones de los hechos
que las apoyan.
Capacidad
de reconocer suposiciones implícitas:
|
|
El autor de un
libro reciente sobre la medición dice que los estudiantes responderán
correctamente el 50% de las preguntas de un examen de verdadero-falso dando
respuestas al tanteo. ¿Cuál de las siguientes suposiciones está haciendo el
autor? A)
Los estudiantes harán conjeturas basados en su
información. B)
Los estudiantes responderán meramente al tanteo. C)
Las conjeturas de los estudiantes recibirán la
ayuda de ciertos determinantes específicos D)
Las conjeturas de los estudiantes
recibirán el apoyo tanto de la información parcial como ciertos determinantes
específicos. |
4.20 EL ANÁLISIS DE RELACIONES, incluirá resultados como la identificación de
relaciones entre ideas, el reconocimiento de relaciones de causa y efecto y la
habilidad para distinguir los argumentos pertinentes de los que no lo son.
Capacidad
para identificar relaciones entre ideas.
Lea
los siguientes dos enunciados y elija la respuesta que explique mejor la
relación entre ambos:
Uno: En igualdad de circunstancias, un
examen más extenso es más confiable que otro más corto.
Dos: En igualdad de circunstancias, un
examen de opción múltiple de 50 preguntas es más confiable que otro de
verdadero y falso de 50 preguntas.
La
relación entre estos enunciados se puede expresar mejor de la siguiente manera:
A)
Las
condiciones descritas en el enunciado dos contradicen el principio del
enunciado uno.
B)
Las
condiciones del enunciado dos pueden explicarse por el principio del enunciado
uno.*
C)
Las
condiciones del enunciado dos nos contradicen el principio del enunciado uno ni
se pueden explicar en virtud de éste.
En este último
reactivo el estudiante debe reconocer que al aumentar el número de las opciones
de las preguntas produce el mismo efecto que acrecentar el examen.
4.30 EN EL ANÁLISIS DE LOS
PRINCIPIOS ORGANIZADORES, se necesita que el estudiante reconozca o infiera
la forma, pauta o estructura que esté
implícitas en una comunicación (es decir la selección de material escrito,
poema, composición musical y pintura). Así pues, comprende la capacidad de
identificar aspectos como el propósito del escritor, su punto de vista, sus
prejuicios, sus técnicas de persuasión o su forma literaria. Este es uno de los
niveles de análisis más complejo es necesario para entender completamente una
obra literaria, música y pintura. Generalmente es menos importante en otras
áreas.
Capacidad de
reconocer el punto de vista de un escritor.
|
1. |
¿Cuál
de los siguientes enunciados expresa mejor el punto de vista del autor acerca
de los exámenes de aprovechamiento? A) Se
debe mantener la objetividad incluso si alguno de los resultados del
aprendizaje se mide indirectamente B) Los
resultados del aprendizaje se deben medir directamente incluso cuando haya
que usar medidas menos objetivas* C)
Ni medir los directamente los resultados del
aprendizaje ni mantener la objetividad, son coincidentes tan importantes como
la de seguir fielmente las reglas de los reactivos |
Este tipo de
reactivos miden únicamente las formas más elementales de la conducta, este tipo
de preguntas se pueden presentar como la descripción de un experimento, una
pintura o algún producto nuevo para el estudiante. Haciéndole preguntas
adecuadas se le puede pedir al estudiante que analice todos los aspectos como:
elementos, relaciones y estructura del material en cuestión. Este tipo de
preguntas nos permiten determinar si un estudiante tiene las habilidades y
conocimientos necesarios para enfocar necesariamente, resultados de aprendizaje
significativos por sí mismos
La síntesis
consiste en unir las partes para formar un producto que es nuevo para el
estudiante. Así pues, el proceso supone cierto grado de actividad creativa, que
será determinado por la tarea específica.
Se han supuesto tres tipos de síntesis según Bloom:
5.10 COMUNICACIÓN ORIGINAL, es
lo que se pide del estudiante como un ensayo, un cuento, un poema, una
composición musical o un discurso.
5.20 UN PLAN O UNA SERIE PROPUESTA
DE OPERACIÓN, el
estudiante debe producir el plan de un experimento, las especificaciones para
elaborar un vestido o un mueble, un proyecto científico o de acción social.
5.30 CONJUNTO DE RELACIONES
ABSTRACTAS, como una hipótesis que explique diversos fenómenos,
una teoría sencilla o un esquema conceptual para clasificar cosas o
acontecimientos.
Aquí se pretende
medir la capacidad del individuo para producir y organizar ideas originales,
también se puede medir la habilidad de escribir, como la capacidad de elegir
las mejores palabras para expresar una idea o la habilidad de ordenar frases
desordenadas para construir párrafos coherentes.
La evaluación del
aprendizaje a nivel de síntesis depende principalmente de la estimación del
producto. De ordinario se requiere que el estudiante produzca algo que necesita
del tipo de síntesis reflejado en los objetivos de enseñanza y se juzga la
calidad del producto resultante con arreglo a criterios claramente definidos.
En este tipo de
reactivos se pretende medir los objetivos de la enseñanza relativos a una
unidad de trabajo o que se elaboren dos tipos de preguntas) elaboración de una
comunidad original), que prepare un conjunto de especificaciones para un examen
de aprovechamiento (producción de un conjunto propuesto de operaciones), o que
desarrolle un sistema para clasificar los resultados del aprendizaje,
exclusivos de un área en particular (producción de un conjunto de relaciones
abstractas).
Al evaluar un
reactivo de síntesis no se busca que el estudiante se apegue a todos los pasos
de los procedimientos, y tampoco dejar en entera libertad su expresión
creativa. Lo más adecuado es un justo medio que permita alguna creatividad pero
que incluya límites establecidos por las convenciones ordinariamente aceptadas.
6.00 NIVEL TAXONÓMICO DE EVALUACIÓN
La evaluación comprende
la capacidad de juzgar conscientemente el valor de una cosa, con un fin
determinado y con base en criterios definidos. Tanto en carácter consciente del
juicio como el uso de criterios son las características principales que
permiten distinguir el nivel cognoscitivo de evaluación., recalcado en las
decisiones basadas en la categoría de la opinión. La evaluación es la más
compleja de las conductas cognitivas. Incluye ciertos elementos del
conocimiento, la comprensión, el análisis y síntesis, más el uso de criterios y
de juicios de valor (Bloom).
La capacidad de evaluar se puede dividir en dos
tipos:
Algunos aspectos
específicos del proceso de evaluación se pueden medir con preguntas objetivas;
por ejemplo, resultados como la capacidad de detectar falacias lógicas en los
argumentos, la de reconocer criterios apropiados para juzgar cierta situación,
la de reconocer criterios apropiados para juzgar cierta situación, la de
percibir diversos tipos de errores y la de identificar relaciones entre los
medios y los fines. No obstante, la medición de tales aspectos individuales de
la evaluación carecen de las capacidades de análisis y de síntesis que se
requieren en la apreciación total de una obra. Tal vez sea posible clasificar
más adecuadamente estas capacidades en el nivel de aplicación.
Una apreciación
exhaustiva a nivel de la evaluación demandaría que se le diera al estudiante
una obra completa y se le pidiera que:
En el área de los
exámenes de aprovechamiento total, por ejemplo, se le puede dar al estudiante
un examen de aprovechamiento total, el cual tendría que evaluar en función de
testimonios internos (por ejemplo, concisión de las instrucciones, claridad y
disposición de las preguntas y legibilidad) en función de criterios que
utilizar, o se le puede pedir que suministre los suyos.
Como en el caso
del nivel de síntesis, las capacidades cognoscitivas y el nivel de evaluación
pueden ser estimados más eficazmente cuando se le pide al estudiante que evalúe
críticamente toda la obra. Entonces se puede determinar el grado en que el
estudiante ha logrado desarrollar su capacidad al nivel de evaluación, juzgando
la calidad de su informe escrito.
En ocasiones es
más fácil medir más efectivamente los resultados complejos del aprendizaje,
fundamentando una serie de preguntas en una sección común de material
introductorio. Este puede ser un párrafo, una tabla, una gráfica, un mapa o un
dibujo. Se pueden diseñar las preguntas que siguen al material introductorio de
manera que revelen cualquiera de las capacidades y habilidades intelectuales,
descritas en la taxonomía y que sean susceptibles de medición objetiva. Con
este tipo de preguntas, se usan profusamente tanto los de opción múltiple como
los de respuesta opcional.
ANEXO II
Formato para la
elaboración de reactivos
|
Número de
reactivo: |
|
|
Grupo: |
|
|
Autor: |
|
|
Tema: |
|
|
Subtema: |
|
|
*Clasificación/Accidentes: |
(AP, S, G.M) |
|
Ramo |
|
|
Nivel
Taxonómico: |
|
BASE DEL REACTIVO
OPCIONES:
A)
B)
C)
D)
OPCIÓN CORRECTA
( )
|
Razonamiento |
|
A)
|
|
B)
|
|
C)
|
|
D)
|
ANEXO III
A)
Valores de y z :
|
|
z |
|
z |
|
0.10 |
1.6449 |
0.05 |
1.9600 |
|
0.01 |
2.5758 |
0.005 |
2.8070 |
|
0.001 |
3.2905 |
0.0005 |
3.4808 |
|
0.0001 |
3.8906 |
0.00005 |
4.0510 |
|
0.00001 |
4.4172 |
0.00000 |
5.0000 |
B)
|
TABLA DE RAICES
CUADRADAS DEL 0 AL 99 |
||||||||||
|
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
0
|
|
1.0 |
1.4 |
1.7 |
2.0 |
2.2 |
2.4 |
2.6 |
2.8 |
3.0 |
|
1
|
3.2 |
3.3 |
3.5 |
3.6 |
3.7 |
3.9 |
4.0 |
4.1 |
4.2 |
4.4 |
|
2
|
4.5 |
4.6 |
4.7 |
4.8 |
4.9 |
5.0 |
5.1 |
5.2 |
5.3 |
5.4 |
|
3
|
5.5 |
5.6 |
5.7 |
5.7 |
5.8 |
5.9 |
6.0 |
6.1 |
6.2 |
6.2 |
|
4
|
6.3 |
6.4 |
6.5 |
6.6 |
6.6 |
6.7 |
6.8 |
6.9 |
6.9 |
7.0 |
|
5
|
7.1 |
7.1 |
7.2 |
7.3 |
7.3 |
7.4 |
7.5 |
7.5 |
7.6 |
7.7 |
|
6
|
7.7 |
7.8 |
7.9 |
7.9 |
8.0 |
8.1 |
8.1 |
8.2 |
8.2 |
8.3 |
|
7
|
8.4 |
8.4 |
8.5 |
8.5 |
8.6 |
8.7 |
8.7 |
8.8 |
8.8 |
8.9 |
|
8
|
8.9 |
9.0 |
9.1 |
9.1 |
9.2 |
9.2 |
9.3 |
9.3 |
9.4 |
9.4 |
|
9
|
9.5 |
9.5 |
9.6 |
9.6 |
9.7 |
9.7 |
9.8 |
9.8 |
9.9 |
9.9 |
[1]
Contenidos tomados del Tema 8 del
libro “Desarrollo personal para
ejecutivos” de Bert Juch, México: Limusa, 1987. Es interesante que todo el
libro trate de capacitación de ejecutivos, utilizando un esquema de aprendizaje
circular con un enfoque psicológico que puede ser aplicado a la aulas.
[2]
Entre las más conocidas se
encuentran las de Bloom (1956), Gagné (1970) y Tuckman (1979), aunque existen otros enfoque diferentes o
complementarios. En este documento sólo se aborda el Dominio Cognoscitivo, pero
lo complementan el Afectivo y el Conductual. Asimismo, faltaría la evaluación
del docente y del entorno.
[4] Una forma más precisa consiste en obtener
la correlación Producto-Momento entre las respuestas al ítem y la suma de
respuestas al tema al que corresponde, restando a la suma las respuestas del
ítem que se evalúa.
[6] Si al dividir los grupos al 50% el puntaje
central no es específico de uno de los grupos, deberá ubicar en el grupo superior (S) o en el grupo
inferior (I) todos los puntajes que sean iguales y dividir el número de
aciertos entre el número de casos de cada grupo: (S/nS-I/nI).
Este procedimiento evitará el sesgo por cantidad de casos diferentes en los
grupos.
[7]
Tomado de Rosado, M., Aduna, P. y
García, E. Estadística aplicada.
Materiales didácticos para cursos de métodos numéricos y apoyo a métodos de
investigación o evaluación. (En prensa). Tlaxcala: Universidad Autónoma de
Tlaxcala, Depto. de Posgrado en Educación.
[9] En las regresiones la predicción es válida
dentro del rango de los valores reales, pero en los valores que exceden este
rango, pero fuera de este rango la predicción puede tener mucha variabilidad.
En términos generales debe plantearse como: “Si las condiciones del grupo y de
la variable permanecen constantes, el valor estimado será...”
[10]
Psicólogo y pedagogo estadounidense, profesor en la Universidad de Chicago.
Especialista en teoría del currículum, sus aportaciones principales: el
desarrollo de un nuevo enfoque de enseñanza, el del aprendizaje para el dominio
y la dirección de un equipo que formuló una taxonomía de los objetivos de la educación, referida al dominio
fundamental cognoscitivo (1956).
[11] Diccionario de las ciencias de la
educación. Santillana, México. 1988. Pág. 1327
[12]
GRONLUD, Norman. Elaboración de test de aprovechamiento. México,
Trillas. 2001. p-p. 28-29