N I PSICOMETRÍA - us
Transcript of N I PSICOMETRÍA - us
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
PSICOMETRÍAPSICOMETRÍA
Tema 7 Baremación, estandarización y equiparación de puntuaciones
Salvador Chacón MoscosoSusana Sanduvete Chaves
Agradecemos a Francisco Pablo Holgado Tello su inestimable colaboración en la elaboración de este material
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
2
Tema 7 Baremación, estandarización y equiparación de
puntuaciones1. Asignación de puntuaciones.2. Establecimiento de puntos de corte en los tests referidos
al criterio. 21. Procedimientos centrados en el test.
2.2. Procedimientos centrados en las personas.2.3. Procedimientos de compromiso.
3. Transformación de puntuaciones en tests normativos.3.1. Transformaciones lineales de las puntuaciones.3.2. Transformaciones no-lineales de las puntuaciones.3.3. Normas cronológicas3.4. Establecimiento y tipos de normas.
4. Equiparación de puntuaciones.4.1. Definición de equiparación y términos relacionados.4.2. Diseños de equiparación.4.3. Métodos de equiparación.
5. Elaboración de la documentación que acompaña al test.5.1. El manual del test.
6. Valoración de la TCT. 7. Bibliografía básica.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
3
Asignación de puntuaciones
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
4
ASIGNACIÓN DE PUNTUACIONES
ASIGNACIÓN DE PUNTUACIONES:
Una vez administrado el conjunto de ítems, las puntuaciones obtenidas deben combinarse para obtener una que refleje la posición del sujeto en el test.
Puntuaciones en test formados por ítems dicotómicos, encontramos varias situaciones a tener en cuenta para asignar la puntuación total:
a)El sujeto conoce la respuesta correcta.
b)El sujeto no conoce la respuesta correcta:
b.1- omite el ítem
b.2- responde incorrectamente
b.3- elija la respuesta correcta por azar.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
5
1. Puntuaciones de tests formados por ítems sin opciones (completar, respuesta corta,...): Sumar las puntuaciones de los ítems (1 acierta; 0 falla).
n
iaia xX
1
Donde; Xa es la puntuación total del sujeto a y xai es la respuesta del examinado a al ítem i.
Todos los ítems reciben el mismo peso y no se puntúan los ítems en
blanco u omitidos
ASIGNACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
6
2. Puntuaciones de tests con ítems de opción múltiple o V-F: existencia de diferencias individuales en relación a la tendencia a omitir o responder a ítems de los que no se conoce la respuesta variación adicional a las puntuaciones observadas, ajena al rasgo que mide el test.
Ejemplo. Dos sujetos responden a 100 ítems de 4 opciones. Ambos conocen sólo 72 ítems, pero mientras que el sujeto A responde a los 28 restantes por adivinación, el sujeto B los deja sin responder.
797724
2872
100
1
i
AiA xX 7272072100
1
i
BiB xX
Esta diferencia de 7 puntos, no tiene nada que ver con sus conocimientos, sino con la diferencia en la
respuesta a los ítems que no conoce
1. Responde correctamente a los 72 más a 7 por mero azar su puntuación es de 79.
2. Sólo responde correctamente a los 72 ítems que conoce su puntuación es de 72.
ASIGNACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
7
2.1. Corrección penalizando los errores:
Donde: A es el número de aciertos; E, es el número de errores; y k el número de alternativas del ítem.
1k
EAX c
723
072
1
k
EAX B72779
3
2179
1
k
EAX A
1. El sujeto A, responde correctamente a los 72 más a 7 por mero azar y comete 21 errores que penalizan restando 7 puntos su puntuación es de 72
2. El sujeto B, sólo responde correctamente a los 72 ítems que conoce, luego no comete ningún error su puntuación sigue siendo de 72
ASIGNACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
8
2.2. Corrección bonificando las omisiones: atribuye a los sujetos una serie de aciertos adicionales que hubiese tenido si contestase al azar los ítems que no respondió.
Donde: B es el número de ítems dejados en blanco; y k el número de alternativas del ítem.
k
BAX c
797724
2872
k
BAX B79
4
079
k
BAX A
1. El sujeto A, responde correctamente a los 72 más a 7 por mero azar, y no deja ninguno sin responder su puntuación sea de 79.
2. El sujeto B, sólo responde correctamente los 72 ítems que conoce; y se le suma 7 que hubiera respondido correctamente por azar su puntuación es de 79
ASIGNACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
9
Estudios empíricos muestran que los sujetos no se comportan según los supuestos de las fórmulas de corrección, es decir, los sujetos que no conocen el ítem, normalmente no responden totalmente al azar:
1. No tienen en cuenta el conocimiento parcial de los sujetos sobre algunos ítems.
2. Diferencias individuales en la conducta de asumir riesgos a la hora de responder a los ítems.
ASIGNACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
10
Por tanto, es necesario destacar que entre los sujetos que tienen la misma puntuación en un test de elección múltiple, puede haber diferentes grados de conocimiento. A ello se le denomina: Créditos de conocimiento parcial.
Crocker y Algina (1986) proponen distintos métodos para controlarlo:
a) Ponderación de confianza.
b) Elegir hasta la respuesta correcta.
c) Ponderación de las opciones.
ASIGNACIÓN DE PUNTUACIONES. Créditos para el conocimiento parcial
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
11
1. Ponderación de confianza:
2. Hasta la respuesta correcta:
3. Ponderación de las opciones:
En general, estos procedimientos no han mostrado mejoras respecto a la validez de las pruebas
ASIGNACIÓN DE PUNTUACIONES. Créditos para el conocimiento parcial
Elegir la opción que se cree más correcta y asignar un valor en función del grado de corrección que atribuye a su respuesta sujetos que eligen la misma respuesta pueden obtener distinta puntuación en función del grado de confianza que han atribuido.
Se selecciona una opción, y se recibe feedback. Si la respuesta es correcta pasa al siguiente ítem; si es incorrecta debe hacer una nueva elección. para puntuar el test, se resta el número total de respuestas de las que ha realizado el sujeto.
Las opciones pueden variar en cuanto al grado de corrección; los sujetos que eligen la correcta tienen más nivel de los examinados que eligen la menos correcta. para determinar los pesos suele utilizarse juicio de expertos.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
12
Puntos de corte en TRC
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
13
Una empresa desea promocionar un puesto de trabajo. Aplica un test de 70 ítems de elección múltiple. Un empleado obtiene 40 puntos. Con estos datos podríamos preguntarnos:
-1. ¿podríamos decir que el rendimiento del sujeto sería adecuado para dicho puesto, o hay sujetos más competentes?
-2. ¿debería realizar un cursillo intensivo de adecuación al nuevo puesto?
INTERPRETACIÓN DE PUNTUACIONES. TRN Y TRC
Si sólo nos centramos en que ha obtenido 40 puntos de 70, no podríamos responder a ninguna cuestión. Para ello:
1. Seleccionar una muestra representativa, y a continuación realizar una distribución de frecuencias, y comprobar el lugar que ocupa nuestro sujeto dentro de su grupo y así determinar si hay sujetos más competentes.
2. Establecer un criterio para discernir si el sujeto está por encima y por tanto ocupa el puesto, o si está por debajo y por tanto ha de acudir al curso de formación.
La puntuación del sujeto es la misma en ambos casos (40). Sin embargo, la interpretación que hacemos para responder ambas cuestiones es muy
distinta; en un caso es referida a la NORMA; y en el otro referida al CRITERIO
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
14
ESTABLECIMIENTO DEL PUNTO DE CORTE EN LOS TRC
Test referidos a NORMAS Test referidos al CRITERIO
1. Finalidad de la evaluación- poner de relieve las diferencias individuales en el rasgo que mide el test
- estimar el rendimiento de los sujetos en los objetivos que mide el test
2. Construcción del test y especificación de los contenidos.- los ítems suelen derivarse de alguna teoría.
- se comienza con una clara especificación del dominio y del uso pretendido del test.
3. Selección de ítems.- se ha de maximizar la varianza del test, seleccionando ítems de dificultad media y alto poder discriminativo.
- los ítems se seleccionan en función de los objetivos y uso pretendido del test.
4. Significado de puntuaciones.- Suponen un indicador de la puntuación verdadera del sujeto.
- Supone un estimador muestral del rendimiento del sujeto en el dominio.
5. Interpretación de puntuaciones- la puntuación tiene significado únicamente en relación al grupo
- la puntuación tiene significado en términos absolutos.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
15
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE
TESTS REFERIDOS AL CRITERIO:
Una de las principales funciones de los test es proporcionar datos para la toma de decisiones establecimiento de PUNTOS DE CORTE para decidir sobre el rendimiento de los sujetos.
Punto de corte o estándar: es un punto de la escala que sirve para clasificar a los sujetos en dos categorías que suponen diferentes niveles de competencia en relación a un dominio.
1. Métodos centrados en el test: juicios de los expertos acerca de los ítems del test.
2. Métodos centrados en las personas: opiniones de los jueces sobre la competencia de las personas.
3. Procedimientos de compromiso: combina criterios absolutos (como los anteriores), con criterios relativos.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
16
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Nedelsky
Métodos centrados en el test:
1.1. Método de Nedelsky (1954): es un método muy utilizado en los test de competencia mínima.
a) Identificar una población de jueces y seleccionar una muestra.
b) Cada juez debe definir un sujeto mínimamente competente y predecir la conducta de ese examinado en cada una de las opciones de los distintos ítems indicando cuáles eliminaría.
c) Para cada ítem, el juez registra el recíproco del número de alternativas que quedan. Por ejemplo, en un ítem de 3 alternativas, si se ha eliminado 1, el recíproco sería 1/2 .
d) Para cada juez, se suman los recíprocos de todos los elementos del test, obteniéndose el valor esperado del test en cada juez.
e) Se promedian los valores obtenidos de todos los jueces, y ese valor se toma como valor inicial del estándar.
Asume que los examinados mínimamente competentes eligen al azar de entre las alternativas que no pueden
identificar inmediatamente como incorrectas. Lo que es cuestionable
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
17
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Angoff
Métodos centrados en el test:
1.2. Método de Angoff (1971): introduce una variación al método de Nedelsky.
a) Identificar una población de jueces y seleccionar una muestra.
b) Cada juez debe definir qué significa para él la competencia mínima; y consensuarla con el resto de jueces.
c) Considerar cada ítem del test y decidir para cada uno de ellos la probabilidad de que un examinado mínimamente competente responda al ítem correctamente (estimación a-priori de la dificultad)
d) Para obtener el punto de corte se suman todas las probabilidades y se promedian para todos los jueces.
Es el método más utilizado, investigado y recomendado
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
18
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de EbelMétodos centrados en el test:
1.3. Métodos de Ebel (1972): Propuso un procedimiento parecido al de Angoff, pero considerando la relevancia (esencial; importante; aceptable; y cuestionable); y el nivel de dificultad (fácil; medio; difícil) del ítem. Se origina una tabla bidimensional en la que se categoriza cada ítem.
a) Identificar una población de jueces y seleccionar una muestra.
b) Clasificar cada uno de los elementos del test, en la correspondiente casilla; y contar el número de ítem de cada casilla.
c) Cada juez asigna un porcentaje que representa el de ítems de cada casilla que podrían ser respondidos correctamente por un sujeto mínimamente competente.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
19
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Ebel
Métodos centrados en el test:
1.3. Métodos de Ebel (1972): relevancia (esencial; importante; aceptable; y cuestionable); nivel de dificultad (fácil; medio; difícil) del ítem. Se origina una tabla bidimensional en la que se categoriza cada ítem.
a) Se determina el punto de corte, de acuerdo con la siguiente fórmula:
celda. cadaen ítems de númeroM
acertar. de ha competente emínimament sujetoun que ítems de proporción la es
:
)(1
p
Donde
MpXr
ic
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
20
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método del grupo límite.
Métodos centrados en las personas
2.1.Método del grupo límite: cuando hay evidencias claras de qué examinados son aptos y no-aptos, puede evaluarse el test y su punto de corte. Zieky y Livingston (1977):
a) Identificar una población de jueces y seleccionar una muestra. Es imprescindible que sean capaces de juzgar el nivel de rendimiento de los sujetos por las puntuaciones del test.
b) Se pide a los jueces que definan tres categorías: competente; límite; e inadecuado o incompetente.
c) Los jueces evalúan a los examinados, y basándose en otras informaciones calificarían al grupo de los “límites”.
d) Tras asignar los sujetos a los grupos, se aplica el test. Y se calcula la mediana de las puntuaciones obtenidas por los sujetos de la categoría “límite”; y ese valor se toma como estándar o punto de corte.
Destaca su simplicidad. La principal crítica es la capacidad que se atribuye a los jueces para evaluar a los
sujetos.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
21
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método de los grupos de contraste.
Métodos centrados en las personas
2.2. Método de los grupos de contraste (Zieky y Livingston, 1977): Los juicios se basan en el rendimiento de los sujetos examinados.
a) ; b); y c) Las tres primeras fases son iguales que en el método del grupo límite: (Selección de jueces; que definan las categorías; y que clasifiquen a los sujetos).
d) Los sujetos realizan el test; y los estándares se establecen en función del rendimiento de “competentes” e “incompetentes”.
e) Se estable como punto de corte, la puntuación que mejor discrimina entre los dos grupos.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
22
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método de los grupos de contraste
Métodos centrados en las personas
2.2. Método de los grupos de contraste (Zieky y Livingston, 1977): Los juicios se basan en el rendimiento de los sujetos examinados.
Suje
tos
Estándar
Puntuaciones en el test
El punto de corte viene dado por la intersección entre ambas distribuciones: incompetentes y competentes igualar ambos tipos de errores, es decir aptos verdaderos que no pasan el test; y no aptos que sí pasan el test.
F.Neg.
F.Post.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
23
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos de compromiso
3. Procedimientos de compromiso: Los métodos anteriores se basaban en criterios absolutos, ya que son los jueces los que establecen un mínimo para poder pasar, independientemente de lo que haga el grupo. Estos métodos combinan información tanto de carácter absoluto como relativo y tratan de llegar a un compromiso combinando ambos tipos de datos.
3.1. Método de Beuk (1984): Los jueces responden a dos preguntas:
a) porcentaje mínimo de ítems de la prueba que deben responder correctamente las personas para superarla datos absolutos.
b) porcentaje de personas que superarán la prueba datos relativos.
- Finalmente con los datos empíricos del test se establece un punto de corte de compromiso.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
24
ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos de compromiso. Método de Beuk
100
100
Distribución empírica
Porcentaje de ítems
Porc
en
taje
de
pers
on
as
A`
A
xcx
cy
y
1. Se trazan dos ejes: en abscisas el porcentaje de ítems que hay que contestar correctamente (primera de las preguntas); y en ordenadas el de sujetos que obtendrán la puntuación mínima para superar el test.
2. Se calculan las medias de las respuestas de los jueces a los dos preguntas y se obtiene el punto A.
3. Se obtiene la distribución empírica de las puntuaciones de los sujetos en el test
4. Se obtiene el punto A` haciendo pasar por A una recta de pendiente Sy/Sx (respuestas de los jueces a ambas cuestiones).
5. Para obtener el punto de corte, se proyecta A` sobre el eje de abscisas.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
25
Transformación de puntuaciones para la
interpretación en tests normativos
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
26
TRANSFORMACIÓN DE PUNTUACIONES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS
TRANSFORMACIÓN DE PUNTUACIONES EN TRN: La interpretación de las puntuaciones adquieren sentido, cuando se comparan con las puntuaciones obtenidas por el resto de sujetos de la muestra.
Transformación de puntuaciones en test NORMATIVOS: Una vez obtenida las puntuaciones de los sujetos en un test, para facilitar la comprensión, las puntuaciones directas suelen transformarse en otro tipo de puntuaciones.
Objetivo: expresar las puntuaciones directas de tal modo que hagan alusión a la ubicación del sujeto en el grupo.
- Transformaciones lineales: escalas típicas; típicas derivadas.
- Transformaciones no-lineales: percentiles; típicas normalizadas; normalizadas derivadas.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
27
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales
1. Escalas típicas: una vez aplicado el test a toda la muestra, se calcula la media y desviación típica; a partir de lo que se obtienen las puntuaciones típicas (0, 1) Indica el número de desviaciones típicas a las que se encuentra la puntuación del sujeto respecto a la media.
Supone un cambio en el origen de la escala (la media); y de la unidad de medida (desviación típica).
xx S
XXZ
Donde:
es media de la muestra
X es la puntuación directa
Sx es la desviación típica de la distribución
X
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
28
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales
Supongamos que hemos aplicado un test de razonamiento a una muestra de 400 sujetos. Sabemos que la media es de 18; y que la desviación típica es 3. Calcular las puntuaciones típicas de dos sujetos cuyas puntuaciones en el test fueron 16 y 21 respectivamente.
13
1821
66.03
1816
2
1
x
x
S
XXZ
S
XXZ
El principal inconveniente es que presenta valores negativos y decimales dificulta la
interpretación
1. El primer sujeto se encuentra a 0.66 desviaciones típicas por debajo de la media.
2. Mientras que el segundo se encuentra a una desviación típica por encima del grupo.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
29
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales
2. Escalas típicas derivadas: una vez realizada la transformación a escalas típicas, éstas se pueden transformar con media y desviación típica fijada por el usuario es posible evitar valores negativos y decimales.
La transformación se puede expresar como:
xbZaY
Donde:
Y = es puntuación típica derivada
a = es la media de las puntuaciones en la nueva escala
b = es la desviación típica de la nueva escala
Zx = es la puntuación típica en la escala original
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
30
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales
Algunas escalas típicas derivadas de amplio uso son:Escala Media Desviación
típica
Puntuaciones T de McCall (1939)
50 10
Pruebas de clasificación del ejército de EE.UU
100 20
Escala D 50 20Volviendo al ejemplo anterior (Z1=-0.66; Z2=1)
Escala Y=media+SZx
T de McCall (1939) T1= 50+(-0.66)10 = 43.4
T2= 50+(1)10 = 60
Pruebas de clasificación del ejercito de EE.UU
Y1= 100+(-0.66)20 = 86.8Y2= 100+(1)20 = 120
Escala D D1= 50+(-0.66)20= 36.8
D2= 50+(1)20= 70
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
31
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales
Como se ha comprobado, las transformaciones lineales evitan el problema de los números negativos y de los decimales. Sin embargo, la aplicación de un test a dos muestras distintas, da lugar a distribuciones distintas y por tanto es necesario tener cautela a la hora de comparar las puntuaciones de un sujeto con respecto a una muestra concreta. Para ello podemos utilizar las transformaciones no lineales que implican una alteración de la forma de las distribuciones originales.
- Rango percentiles.
- típicas normalizadas.
- normalizadas derivadas.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
32
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales
Rango percentiles: aquella puntuación del test que deja por debajo un determinado porcentaje de casos del grupo normativo. Si por ejemplo, decimos que una puntuación 40 equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. .
)(
100ic
dbc LX
A
ff
NP
Son muy utilizadas para comunicar resultados. Sin embargo no constituyen una escala de intervalo, lo que implica que:
- en diferentes regiones de la escala, una diferencia de 1 punto equivale a magnitudes distintas.
- las ganancias o pérdidas para un sujeto, así como las comparaciones entre sujetos no pueden analizarse en rango percentiles.
- no deben usarse cálculos aritméticos ni estadísticos, tales como medias o comparaciones de grupos.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
33
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales
2. Escalas típicas normalizadas: se obtienen a partir de los percentiles. Se definen como la puntuación típica que le corresponde a una puntuación empírica obtenida por un sujeto en un test suponiendo que la distribución es normal.
1. Determinar los rangos percentiles correspondientes a cada una de las puntuaciones directas.
2. Asumiendo que la variable se distribuye normalmente, buscar en la tabla de la normal los valores z correspondientes a cada uno de los porcentajes.
Si por ejemplo, decimos que una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. Si asumimos que se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas, que en este caso equivale a 1.28: Zp=90=1.28.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
34
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales
3. Escalas normalizadas derivadas (estaninos o eneatipos): las típicas normalizadas, presentan el inconveniente de los valores negativos y decimales. Ello, se puede superar mediante la transformación de las puntuaciones típicas normalizadas, a normalizadas derivadas.
Estaninos: son una escala de valores enteros y positivos de 9 unidades (1 al 9). Son una transformación lineal de las típicas normalizadas con media 5 y desviación típica 2.
E=5+2Zn
Si por ejemplo, una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos. Si se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas, que en este caso equivale a 1.28: Zp=90=1.28.
E=5+2(1.28)=7.56 8
Inconveniente: se incluye en el mismo eneatipo a sujetos con la misma puntuación
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
35
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Normas cronológicas
Edad mental (Binet-Simon):
1. Se seleccionan muestras de niños de distinta edad.
2. Se les aplica un test (inteligencia por ejemplo).
3. A cada grupo de edad se le hace corresponder la media obtenida
Cociente intelectual:
1. Se calcula la edad mental del sujeto.
2. Se divide por su edad cronológica.
100EC
EMCI
<100 desarrollo intelectual por debajo del que corresponde con su edad.
=100 desarrollo intelectual y cronológico coinciden
>100 desarrollo intelectual por encima del cronológico
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
36
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Normas cronológicas
Inconvenientes:
El significado de un año de edad mental no es constante con el desarrollo evolutivo de un niño. A medida que se crece la distancia entre años disminuye y se homogeneíza el desarrollo cognitivo el CI es poco discriminativo entre adultos por ejemplo.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
37
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Establecimiento y tipo de normas
ESTABLECIMIENTO Y TIPO DE NORMAS:
Normas; son una descripción de la posición del sujeto respecto del grupo normativo.
- el grupo normativo debe ser representativo de la población y tener un tamaño adecuado para proporcionar estimadores seguros.
- el grupo normativo debe ser homogéneo (todos los sujetos sean miembros de la población objetivo).
- como datos normativos se presentan todos los estadísticos descriptivos. Y en cuanto al tipo de escalas la más habitual es el rango percentil.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
38
TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Establecimiento y tipo de normas
Tipos de normas:
- Normas nacionales: es el tipo más frecuente, y se basan en muestras representativas a nivel nacional.
- Normas locales: son normas basadas en sub-poblaciones definidas sobre unidades geográficas limitadas. Como por ejemplo comunidades autónomas.
- Normas de usuarios y normas de conveniencia: son normas basadas en las puntuaciones de los sujetos a los que se les administra el test durante un período de tiempo determinado, pero sin consideraciones de muestreo. Son muy habituales en los test utilizados en la selección de personal. O en muchas otras ocasiones se basan en grupos de sujetos que simplemente son accesibles al constructor del test.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
39
Equiparación de puntuaciones
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
40
EQUIPARACIÓN DE PUNTUACIONES
EQUIPARACIÓN DE PUNTUACIONES:
la equiparación de puntuaciones de dos o más formas de tests se refiere a establecer una correspondencia entre sus puntuaciones, de tal modo que las puntuaciones de cualquiera de ellos pueda expresarse en términos de las del otro. Es decir, se trata de encontrar una transformación que permita expresar las puntuaciones de un test Y como función de las unidades de otro test X:
Y*=f(X)¿Cuál sería la puntuación de Juan en el test Y, que mide inteligencia, habiendo obtenido una
puntuación de 70 en el test X (también de inteligencia)?
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
41
Condiciones de equiparación:
1. Que los tests midan el mismo constructo; y con la misma fiabilidad.
2. Que para cada grupo de examinados de idéntica aptitud, la distribución de frecuencias condicional sobre el test Y, después de la transformación (Y*), es la misma que la distribución de frecuencias condicional sobre el test X.
3. Invarianza poblacional; es decir, la transformación será la misma independientemente del grupo en el que se obtenga.
4. Simetría: la transformación es invertible, es decir los resultados serán los mismos obteniendo Y*=f(X); que X*=f(Y)
Es poco probable que se cumplan las cuatro condiciones. Y aunque en teoría es posible construir dos formas que midan el mismo constructo y sean igualmente fiables, es
improbable que lo sean en todos los niveles de aptitud.
EQUIPARACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
42
Equiparación horizontal, frente a vertical: la equiparación horizontal hace referencia a que ambos tests son iguales en dificultad. Sin embargo, esto no siempre ocurre, y nos encontramos ante el problema de la equiparación vertical, es decir, cuando los test miden el mismo rasgo pero con distinto nivel de dificultad.
EQUIPARACIÓN DE PUNTUACIONES
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
43
EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación
Diseños de equiparación:
- Diseños de un solo grupo: se administran las dos formas del test, al mismo grupo de sujetos (una tras otra).
- Inconveniente de que existan diferencias debido al cansancio, o al efecto del orden. Para evitarlo se puede utilizar diseños de un solo grupo contrabalanceado dividir a la muestra en dos sub-grupos y aplicar ambas formas pero en orden inverso.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
44
EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación
Diseños de equiparación
2. Diseños de grupos equivalentes: extraen de la población y de forma aleatoria dos muestras de sujetos, y a cada muestra se le aplica una forma del test. Es decir, las dos formas del test son administradas cada una a un grupo de sujetos.
- Ventaja; se evitan los efectos de la fatiga, aprendizaje u orden de aplicación.
- Inconveniente: ambos grupos han de ser equivalente en la aptitud que mide el test. Y requiere amplios tamaños muestrales.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
45
EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación
Diseños de equiparación
3. Diseños de grupos no equivalentes con ítems comunes o diseño de anclaje (es uno de los diseños más utilizados): En cada muestra de sujetos se administra solamente una forma del test, con la peculiaridad de que en ambas muestras se administra un test común (Z, test de anclaje), que permite establecer la equivalencia entre los test a equiparar.
- Test de anclaje interno: ítems comunes que aparecen intercalados entre el resto de ítems (se consideran en la puntuación total): ítems de anclaje.
- Test de anclaje externo: los ítems comunes aparecen formando un test independiente (no se consideran en la puntuación total) test de anclaje.
En cuanto al nº de ítems comunes; al menos el 20% del test total.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
46
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación
Métodos de equiparación: una vez obtenidos los datos mediante los diseños vistos anteriormente, es necesario obtener las puntuaciones mediante distintos métodos estadísticos.
1. Método de la media: se hace corresponder las medias de los test a equiparar. Sean X e Y dos tests distintos, para toda puntuación X podemos establecer que:
Donde:
X* es la puntuación del test Y, equivalente a una del test X.
X es la puntuación del test X.
es la media del test X e Y, respectivamente.
YX ;
YXXYX *
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
47
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método de la media
1. Supongamos dos test X e Y, cuyas medias son, respectivamente, 65 y 70. Un sujeto ha obtenido una puntuación de 60 puntos en el test X ¿qué puntuación le correspondería en el test Y?
Según los datos, un sujeto que en el test X ha obtenido una puntuación de 60, le correspondería una de 65 en el test Y.
655607065* XYX
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
48
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método lineal
Métodos de equiparación
2. Método lineal: se basa en la equiparación de aquellas puntuaciones directas que tienen la misma puntuación típica. Es decir, una determinada puntuación de Y, es equivalente a una de X, si ambas puntuaciones tienen idéntica puntuación Z, con lo que ZX= ZY
Donde:
X* es la puntuación del test Y, equivalente a una del test X.
X es la puntuación del test X.
es la media del test X e Y, respectivamente.
Sx y Sy es la desviación típica de X e Y respectivamente
YX ;
YXXS
SYXdespejando
S
YY
S
XX
X
Y
YX
)(*;
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
49
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método lineal
Si hubiéramos utilizado un diseño de un solo grupo, en el que se administran ambos test. La expresión sería la siguiente:
Por último, si hubiéramos utilizado un diseño de anclaje. La expresión sería la siguiente:
22*
2121
21
21YYXX
XSS
SSYX
XX
YY
)(())(()(
)(* 22112
122
12
22
222
2
ZZbYZZbXXSSbS
SSbSYX yzxz
zzxzx
zzyzy
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
50
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil
Métodos de equiparación
3. Método equipercentil: es el método más habitual, consiste en equiparar aquellas puntuaciones cuyos percentiles son iguales.
1. Calcular en cada test las puntuaciones percentiles que corresponden a cada una de las puntuaciones de ambos test.
2. Representar gráficamente las dos distribuciones de percentiles.
3. Obtener las puntuaciones equivalente en los dos test (X e Y) a partir del gráfico anterior.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
51
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil
3. En la tabla adjunta se presentan las puntuaciones percentiles correspondientes a un grupo de sujetos en dos formas (X e Y) de un test de razonamiento compuesto por 10 ítems.Puntuación Percentil en X Percentil en Y
1 3 3
2 5 5
4 10 14
6 20 26
8 29 40
10 43 57
12 61 72
14 75 82
16 87 91
18 95 97
20 99 99
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
52
EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil
Representamos gráficamente ambas distribuciones:
0
20
40
60
80
100
120
1 2 4 6 8 10 12 14 16 18 20
puntuación directa
per
cen
til
Test X
Test Y
1. Eje de abscisas puntuaciones de X e Y; eje de ordenadas los percentiles.2. Representamos la curva correspondiente a cada test.3. Obtenemos las puntuaciones equivalentes en ambos tests.
- Observamos, que una X=10; le corresponde, aproximadamente, una puntuación equivalente X*=8. Este proceso se sigue con el resto de las puntuaciones.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
53
Documentación del test
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
54
ELABORACIÓN DE LA DOCUMENTACI´NO QUE ACOMPAÑA AL TEST.
EL MANUAL DEL TEST:
Existe la necesidad por parte del constructor del test de dar información a los usuarios para que puedan dar una significación adecuada a las puntuaciones obtenidas por un sujeto en el test ELABORACIÓN DEL MANUAL DEL TEST.
Para Yela (1984), la información a incluir sería la misma que la que se incluiría en un informe científico:
-Especificación del test.
-Descripción del test.
-La justificación.
-Referencias bibliográficas.
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
55
ELABORACIÓN DE LA DOCUMENTACIÓN QUE ACOMPAÑA AL TEST.
1. Especificación del test: denominación y clasificación del test (tipo de constructo que evalúa); tipo de material (impreso y manipulativo); y al método de administración (individual o colectiva).
2. Descripción del test:
2.1. Introducción donde se explique el objetivo del test; su relación con otros tests; y sus antecedentes y desarrollo del test.
2.2. Explicitar el campo de aplicación (aspectos psicológicos que se pretende estudiar).
2.3. Instrucciones de aplicación, y tiempos de los que se dispone para la ejecución de cada una de las partes.
2.4. Indicar la forma de puntuar, para ello, se incluirán plantillas con soluciones; así como ejemplos comentados.
3. La justificación: incluye los datos cuantitativos que justifican el uso del test (fiabilidad, validez y tipificación del test).
4. Referencias bibliográficas.
Ejemplo: manual BFQ-NEjemplo: manual BFQ-N
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
56
VALORACIÓN DE LA TEORIA CLÁSICA DE LOS TEST
VALORACIÓN DE LA TCT:
Los procedimientos vistos se han desarrollado bajo la TCT, que ha sido y sigue siendo uno de los modelos psicométricos mas influyentes dentro del campo de la medición en Psicología.
- Ventajas:
Sencillez, claridad y flexibilidad de sus conceptos
Partiendo de supuestos mínimos, proporciona solución a una gama amplia de problemas de medición.
- Limitaciones:
Los supuestos no se pueden comprobar empíricamente
El supuesto de error de medida constante para los diferentes nivel de habilidad es poco plausible
Las propiedades del test y las puntuaciones de los sujetos no son invariantes.
Concepción indiferenciada del error de medida
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
57
A MODO DE SÍNTESIS
-Fiabilidad, validez, y análisis de ítems Evaluación de los sujetos
1. Asignación de puntuaciones (azar y omisiones).
- Créditos para el conocimiento parcial (ponderación de confianza; responder hasta acertar; ponderación de las opciones).
2. Interpretación de las puntuaciones (TRN; y TRC)
3. TRC, y establecimiento de puntos de corte:
-Métodos centrados en el test (ítem como unidad de análisis).
-Métodos centrados en las personas.
-Métodos de compromiso.
4. TRN, y transformación de puntuaciones:
- Lineales (típicas; y típicas derivadas).
- No-lineales (percentiles; típicas normalizadas; normalizadas derivadas)
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
58
5. Equiparación de puntuaciones.
-Diseños: un solo grupo; grupos equivalentes; y anclaje.
-Métodos: media; lineal; equipercentil.
6. Manual del test: especificación; descripción; justificación; y bibliografía.
7. Valoración de la TCT: ventajas, y limitaciones.
A MODO DE SÍNTESIS
TEM
A 7
: B
AR
EM
AC
IÓN
ES
TA
ND
AR
IZA
CIÓ
N E
QU
IPA
RA
CIÓ
N
PU
NTU
AC
ION
ES
59
1. Barbero, I., García, E. Vila, E., y Holgado, F.P. (2010). Psicometría: Problemas resueltos. Madrid: Sanz y Torres.Se trata de un libro de ejercicios y problemas en el que se incluye el desarrollo de la solución. El alumno podrá completar desde un punto de vista aplicado los conceptos y contenidos vistos en la parte teórica; así como adquirir las destrezas necesarias para la resolución de problemas.2. Barbero, I. (Coord.) , Vila, E. y Holgado, F.P. (2010). Psicometría. Madrid: Sanz y Torres.El capítulo 9 puede servir para preparar los contenidos relacionados con la asignación y transformación de puntuaciones.3.Martínez Arias, R. (1995). Psicometría: Teoría de los Tests Psicológicos y Educativos. Madrid: Síntesis. En el Cap. 20 se tratan los principales aspectos relacionados la asignación de puntuaciones, sus transformaciones; y presenta los principales procedimientos de equiparación. Todo ello está ejemplificado abundantemente.
BIBLIOGRAFÍA COMENTADA