N I PSICOMETRÍA - us

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

PSICOMETRÍAPSICOMETRÍA

Tema 7 Baremación, estandarización y equiparación de puntuaciones

Salvador Chacón MoscosoSusana Sanduvete Chaves

Agradecemos a Francisco Pablo Holgado Tello su inestimable colaboración en la elaboración de este material

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

2

Tema 7 Baremación, estandarización y equiparación de

puntuaciones1. Asignación de puntuaciones.2. Establecimiento de puntos de corte en los tests referidos

al criterio. 21. Procedimientos centrados en el test.

2.2. Procedimientos centrados en las personas.2.3. Procedimientos de compromiso.

3. Transformación de puntuaciones en tests normativos.3.1. Transformaciones lineales de las puntuaciones.3.2. Transformaciones no-lineales de las puntuaciones.3.3. Normas cronológicas3.4. Establecimiento y tipos de normas.

4. Equiparación de puntuaciones.4.1. Definición de equiparación y términos relacionados.4.2. Diseños de equiparación.4.3. Métodos de equiparación.

5. Elaboración de la documentación que acompaña al test.5.1. El manual del test.

6. Valoración de la TCT. 7. Bibliografía básica.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

3

Asignación de puntuaciones

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

4

ASIGNACIÓN DE PUNTUACIONES

ASIGNACIÓN DE PUNTUACIONES:

Una vez administrado el conjunto de ítems, las puntuaciones obtenidas deben combinarse para obtener una que refleje la posición del sujeto en el test.

Puntuaciones en test formados por ítems dicotómicos, encontramos varias situaciones a tener en cuenta para asignar la puntuación total:

a)El sujeto conoce la respuesta correcta.

b)El sujeto no conoce la respuesta correcta:

b.1- omite el ítem

b.2- responde incorrectamente

b.3- elija la respuesta correcta por azar.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

5

1. Puntuaciones de tests formados por ítems sin opciones (completar, respuesta corta,...): Sumar las puntuaciones de los ítems (1 acierta; 0 falla).

n

iaia xX

1

Donde; Xa es la puntuación total del sujeto a y xai es la respuesta del examinado a al ítem i.

Todos los ítems reciben el mismo peso y no se puntúan los ítems en

blanco u omitidos


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

6

2. Puntuaciones de tests con ítems de opción múltiple o V-F: existencia de diferencias individuales en relación a la tendencia a omitir o responder a ítems de los que no se conoce la respuesta variación adicional a las puntuaciones observadas, ajena al rasgo que mide el test.

Ejemplo. Dos sujetos responden a 100 ítems de 4 opciones. Ambos conocen sólo 72 ítems, pero mientras que el sujeto A responde a los 28 restantes por adivinación, el sujeto B los deja sin responder.

797724

2872

100

1

i

AiA xX 7272072100

1

i

BiB xX

Esta diferencia de 7 puntos, no tiene nada que ver con sus conocimientos, sino con la diferencia en la

respuesta a los ítems que no conoce

1. Responde correctamente a los 72 más a 7 por mero azar su puntuación es de 79.

2. Sólo responde correctamente a los 72 ítems que conoce su puntuación es de 72.


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

7

2.1. Corrección penalizando los errores:

Donde: A es el número de aciertos; E, es el número de errores; y k el número de alternativas del ítem.

1k

EAX c

723

072

1

k

EAX B72779

3

2179

1

k

EAX A

1. El sujeto A, responde correctamente a los 72 más a 7 por mero azar y comete 21 errores que penalizan restando 7 puntos su puntuación es de 72

2. El sujeto B, sólo responde correctamente a los 72 ítems que conoce, luego no comete ningún error su puntuación sigue siendo de 72


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

8

2.2. Corrección bonificando las omisiones: atribuye a los sujetos una serie de aciertos adicionales que hubiese tenido si contestase al azar los ítems que no respondió.

Donde: B es el número de ítems dejados en blanco; y k el número de alternativas del ítem.

k

BAX c

797724

2872

k

BAX B79

4

079

k

BAX A

1. El sujeto A, responde correctamente a los 72 más a 7 por mero azar, y no deja ninguno sin responder su puntuación sea de 79.

2. El sujeto B, sólo responde correctamente los 72 ítems que conoce; y se le suma 7 que hubiera respondido correctamente por azar su puntuación es de 79


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

9

Estudios empíricos muestran que los sujetos no se comportan según los supuestos de las fórmulas de corrección, es decir, los sujetos que no conocen el ítem, normalmente no responden totalmente al azar:

1. No tienen en cuenta el conocimiento parcial de los sujetos sobre algunos ítems.

2. Diferencias individuales en la conducta de asumir riesgos a la hora de responder a los ítems.


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

10

Por tanto, es necesario destacar que entre los sujetos que tienen la misma puntuación en un test de elección múltiple, puede haber diferentes grados de conocimiento. A ello se le denomina: Créditos de conocimiento parcial.

Crocker y Algina (1986) proponen distintos métodos para controlarlo:

a) Ponderación de confianza.

b) Elegir hasta la respuesta correcta.

c) Ponderación de las opciones.

ASIGNACIÓN DE PUNTUACIONES. Créditos para el conocimiento parcial

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

11

1. Ponderación de confianza:

2. Hasta la respuesta correcta:

3. Ponderación de las opciones:

En general, estos procedimientos no han mostrado mejoras respecto a la validez de las pruebas

ASIGNACIÓN DE PUNTUACIONES. Créditos para el conocimiento parcial

Elegir la opción que se cree más correcta y asignar un valor en función del grado de corrección que atribuye a su respuesta sujetos que eligen la misma respuesta pueden obtener distinta puntuación en función del grado de confianza que han atribuido.

Se selecciona una opción, y se recibe feedback. Si la respuesta es correcta pasa al siguiente ítem; si es incorrecta debe hacer una nueva elección. para puntuar el test, se resta el número total de respuestas de las que ha realizado el sujeto.

Las opciones pueden variar en cuanto al grado de corrección; los sujetos que eligen la correcta tienen más nivel de los examinados que eligen la menos correcta. para determinar los pesos suele utilizarse juicio de expertos.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

12

Puntos de corte en TRC

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

13

Una empresa desea promocionar un puesto de trabajo. Aplica un test de 70 ítems de elección múltiple. Un empleado obtiene 40 puntos. Con estos datos podríamos preguntarnos:

-1. ¿podríamos decir que el rendimiento del sujeto sería adecuado para dicho puesto, o hay sujetos más competentes?

-2. ¿debería realizar un cursillo intensivo de adecuación al nuevo puesto?

INTERPRETACIÓN DE PUNTUACIONES. TRN Y TRC

Si sólo nos centramos en que ha obtenido 40 puntos de 70, no podríamos responder a ninguna cuestión. Para ello:

1. Seleccionar una muestra representativa, y a continuación realizar una distribución de frecuencias, y comprobar el lugar que ocupa nuestro sujeto dentro de su grupo y así determinar si hay sujetos más competentes.

2. Establecer un criterio para discernir si el sujeto está por encima y por tanto ocupa el puesto, o si está por debajo y por tanto ha de acudir al curso de formación.

La puntuación del sujeto es la misma en ambos casos (40). Sin embargo, la interpretación que hacemos para responder ambas cuestiones es muy

distinta; en un caso es referida a la NORMA; y en el otro referida al CRITERIO

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

14

ESTABLECIMIENTO DEL PUNTO DE CORTE EN LOS TRC

Test referidos a NORMAS Test referidos al CRITERIO

1. Finalidad de la evaluación- poner de relieve las diferencias individuales en el rasgo que mide el test

- estimar el rendimiento de los sujetos en los objetivos que mide el test

2. Construcción del test y especificación de los contenidos.- los ítems suelen derivarse de alguna teoría.

- se comienza con una clara especificación del dominio y del uso pretendido del test.

3. Selección de ítems.- se ha de maximizar la varianza del test, seleccionando ítems de dificultad media y alto poder discriminativo.

- los ítems se seleccionan en función de los objetivos y uso pretendido del test.

4. Significado de puntuaciones.- Suponen un indicador de la puntuación verdadera del sujeto.

- Supone un estimador muestral del rendimiento del sujeto en el dominio.

5. Interpretación de puntuaciones- la puntuación tiene significado únicamente en relación al grupo

- la puntuación tiene significado en términos absolutos.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

15

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE

TESTS REFERIDOS AL CRITERIO:

Una de las principales funciones de los test es proporcionar datos para la toma de decisiones establecimiento de PUNTOS DE CORTE para decidir sobre el rendimiento de los sujetos.

Punto de corte o estándar: es un punto de la escala que sirve para clasificar a los sujetos en dos categorías que suponen diferentes niveles de competencia en relación a un dominio.

1. Métodos centrados en el test: juicios de los expertos acerca de los ítems del test.

2. Métodos centrados en las personas: opiniones de los jueces sobre la competencia de las personas.

3. Procedimientos de compromiso: combina criterios absolutos (como los anteriores), con criterios relativos.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

16

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Nedelsky

Métodos centrados en el test:

1.1. Método de Nedelsky (1954): es un método muy utilizado en los test de competencia mínima.

a) Identificar una población de jueces y seleccionar una muestra.

b) Cada juez debe definir un sujeto mínimamente competente y predecir la conducta de ese examinado en cada una de las opciones de los distintos ítems indicando cuáles eliminaría.

c) Para cada ítem, el juez registra el recíproco del número de alternativas que quedan. Por ejemplo, en un ítem de 3 alternativas, si se ha eliminado 1, el recíproco sería 1/2 .

d) Para cada juez, se suman los recíprocos de todos los elementos del test, obteniéndose el valor esperado del test en cada juez.

e) Se promedian los valores obtenidos de todos los jueces, y ese valor se toma como valor inicial del estándar.

Asume que los examinados mínimamente competentes eligen al azar de entre las alternativas que no pueden

identificar inmediatamente como incorrectas. Lo que es cuestionable

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

17

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Angoff


1.2. Método de Angoff (1971): introduce una variación al método de Nedelsky.


b) Cada juez debe definir qué significa para él la competencia mínima; y consensuarla con el resto de jueces.

c) Considerar cada ítem del test y decidir para cada uno de ellos la probabilidad de que un examinado mínimamente competente responda al ítem correctamente (estimación a-priori de la dificultad)

d) Para obtener el punto de corte se suman todas las probabilidades y se promedian para todos los jueces.

Es el método más utilizado, investigado y recomendado

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

18

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de EbelMétodos centrados en el test:

1.3. Métodos de Ebel (1972): Propuso un procedimiento parecido al de Angoff, pero considerando la relevancia (esencial; importante; aceptable; y cuestionable); y el nivel de dificultad (fácil; medio; difícil) del ítem. Se origina una tabla bidimensional en la que se categoriza cada ítem.


b) Clasificar cada uno de los elementos del test, en la correspondiente casilla; y contar el número de ítem de cada casilla.

c) Cada juez asigna un porcentaje que representa el de ítems de cada casilla que podrían ser respondidos correctamente por un sujeto mínimamente competente.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

19

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en el test. Método de Ebel


1.3. Métodos de Ebel (1972): relevancia (esencial; importante; aceptable; y cuestionable); nivel de dificultad (fácil; medio; difícil) del ítem. Se origina una tabla bidimensional en la que se categoriza cada ítem.

a) Se determina el punto de corte, de acuerdo con la siguiente fórmula:

celda. cadaen ítems de númeroM

acertar. de ha competente emínimament sujetoun que ítems de proporción la es

:

)(1

p

Donde

MpXr

ic

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

20

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método del grupo límite.

Métodos centrados en las personas

2.1.Método del grupo límite: cuando hay evidencias claras de qué examinados son aptos y no-aptos, puede evaluarse el test y su punto de corte. Zieky y Livingston (1977):

a) Identificar una población de jueces y seleccionar una muestra. Es imprescindible que sean capaces de juzgar el nivel de rendimiento de los sujetos por las puntuaciones del test.

b) Se pide a los jueces que definan tres categorías: competente; límite; e inadecuado o incompetente.

c) Los jueces evalúan a los examinados, y basándose en otras informaciones calificarían al grupo de los “límites”.

d) Tras asignar los sujetos a los grupos, se aplica el test. Y se calcula la mediana de las puntuaciones obtenidas por los sujetos de la categoría “límite”; y ese valor se toma como estándar o punto de corte.

Destaca su simplicidad. La principal crítica es la capacidad que se atribuye a los jueces para evaluar a los

sujetos.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

21

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método de los grupos de contraste.


2.2. Método de los grupos de contraste (Zieky y Livingston, 1977): Los juicios se basan en el rendimiento de los sujetos examinados.

a) ; b); y c) Las tres primeras fases son iguales que en el método del grupo límite: (Selección de jueces; que definan las categorías; y que clasifiquen a los sujetos).

d) Los sujetos realizan el test; y los estándares se establecen en función del rendimiento de “competentes” e “incompetentes”.

e) Se estable como punto de corte, la puntuación que mejor discrimina entre los dos grupos.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

22

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos centrados en las personas. Método de los grupos de contraste


2.2. Método de los grupos de contraste (Zieky y Livingston, 1977): Los juicios se basan en el rendimiento de los sujetos examinados.

Suje

tos

Estándar

Puntuaciones en el test

El punto de corte viene dado por la intersección entre ambas distribuciones: incompetentes y competentes igualar ambos tipos de errores, es decir aptos verdaderos que no pasan el test; y no aptos que sí pasan el test.

F.Neg.

F.Post.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

23

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos de compromiso

3. Procedimientos de compromiso: Los métodos anteriores se basaban en criterios absolutos, ya que son los jueces los que establecen un mínimo para poder pasar, independientemente de lo que haga el grupo. Estos métodos combinan información tanto de carácter absoluto como relativo y tratan de llegar a un compromiso combinando ambos tipos de datos.

3.1. Método de Beuk (1984): Los jueces responden a dos preguntas:

a) porcentaje mínimo de ítems de la prueba que deben responder correctamente las personas para superarla datos absolutos.

b) porcentaje de personas que superarán la prueba datos relativos.

- Finalmente con los datos empíricos del test se establece un punto de corte de compromiso.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

24

ESTABLECIMIENTO DE ESTÁNDARES O PUNTOS DE CORTE. Procedimientos de compromiso. Método de Beuk

100

100

Distribución empírica

Porcentaje de ítems

Porc

en

taje

de

pers

on

as

A`

A

xcx

cy

y

1. Se trazan dos ejes: en abscisas el porcentaje de ítems que hay que contestar correctamente (primera de las preguntas); y en ordenadas el de sujetos que obtendrán la puntuación mínima para superar el test.

2. Se calculan las medias de las respuestas de los jueces a los dos preguntas y se obtiene el punto A.

3. Se obtiene la distribución empírica de las puntuaciones de los sujetos en el test

4. Se obtiene el punto A` haciendo pasar por A una recta de pendiente Sy/Sx (respuestas de los jueces a ambas cuestiones).

5. Para obtener el punto de corte, se proyecta A` sobre el eje de abscisas.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

25

Transformación de puntuaciones para la

interpretación en tests normativos

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

26

TRANSFORMACIÓN DE PUNTUACIONES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS

TRANSFORMACIÓN DE PUNTUACIONES EN TRN: La interpretación de las puntuaciones adquieren sentido, cuando se comparan con las puntuaciones obtenidas por el resto de sujetos de la muestra.

Transformación de puntuaciones en test NORMATIVOS: Una vez obtenida las puntuaciones de los sujetos en un test, para facilitar la comprensión, las puntuaciones directas suelen transformarse en otro tipo de puntuaciones.

Objetivo: expresar las puntuaciones directas de tal modo que hagan alusión a la ubicación del sujeto en el grupo.

- Transformaciones lineales: escalas típicas; típicas derivadas.

- Transformaciones no-lineales: percentiles; típicas normalizadas; normalizadas derivadas.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

27

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones lineales

1. Escalas típicas: una vez aplicado el test a toda la muestra, se calcula la media y desviación típica; a partir de lo que se obtienen las puntuaciones típicas (0, 1) Indica el número de desviaciones típicas a las que se encuentra la puntuación del sujeto respecto a la media.

Supone un cambio en el origen de la escala (la media); y de la unidad de medida (desviación típica).

xx S

XXZ

Donde:

es media de la muestra

X es la puntuación directa

Sx es la desviación típica de la distribución

X

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

28


Supongamos que hemos aplicado un test de razonamiento a una muestra de 400 sujetos. Sabemos que la media es de 18; y que la desviación típica es 3. Calcular las puntuaciones típicas de dos sujetos cuyas puntuaciones en el test fueron 16 y 21 respectivamente.

13

1821

66.03

1816

2

1

x

x

S

XXZ

S

XXZ

El principal inconveniente es que presenta valores negativos y decimales dificulta la

interpretación

1. El primer sujeto se encuentra a 0.66 desviaciones típicas por debajo de la media.

2. Mientras que el segundo se encuentra a una desviación típica por encima del grupo.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

29


2. Escalas típicas derivadas: una vez realizada la transformación a escalas típicas, éstas se pueden transformar con media y desviación típica fijada por el usuario es posible evitar valores negativos y decimales.

La transformación se puede expresar como:

xbZaY

Donde:

Y = es puntuación típica derivada

a = es la media de las puntuaciones en la nueva escala

b = es la desviación típica de la nueva escala

Zx = es la puntuación típica en la escala original

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

30


Algunas escalas típicas derivadas de amplio uso son:Escala Media Desviación

típica

Puntuaciones T de McCall (1939)

50 10

Pruebas de clasificación del ejército de EE.UU

100 20

Escala D 50 20Volviendo al ejemplo anterior (Z1=-0.66; Z2=1)

Escala Y=media+SZx

T de McCall (1939) T1= 50+(-0.66)10 = 43.4

T2= 50+(1)10 = 60

Pruebas de clasificación del ejercito de EE.UU

Y1= 100+(-0.66)20 = 86.8Y2= 100+(1)20 = 120

Escala D D1= 50+(-0.66)20= 36.8

D2= 50+(1)20= 70

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

31

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Transformaciones no lineales

Como se ha comprobado, las transformaciones lineales evitan el problema de los números negativos y de los decimales. Sin embargo, la aplicación de un test a dos muestras distintas, da lugar a distribuciones distintas y por tanto es necesario tener cautela a la hora de comparar las puntuaciones de un sujeto con respecto a una muestra concreta. Para ello podemos utilizar las transformaciones no lineales que implican una alteración de la forma de las distribuciones originales.

- Rango percentiles.

- típicas normalizadas.

- normalizadas derivadas.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

32


Rango percentiles: aquella puntuación del test que deja por debajo un determinado porcentaje de casos del grupo normativo. Si por ejemplo, decimos que una puntuación 40 equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. .

)(

100ic

dbc LX

A

ff

NP

Son muy utilizadas para comunicar resultados. Sin embargo no constituyen una escala de intervalo, lo que implica que:

- en diferentes regiones de la escala, una diferencia de 1 punto equivale a magnitudes distintas.

- las ganancias o pérdidas para un sujeto, así como las comparaciones entre sujetos no pueden analizarse en rango percentiles.

- no deben usarse cálculos aritméticos ni estadísticos, tales como medias o comparaciones de grupos.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

33


2. Escalas típicas normalizadas: se obtienen a partir de los percentiles. Se definen como la puntuación típica que le corresponde a una puntuación empírica obtenida por un sujeto en un test suponiendo que la distribución es normal.

1. Determinar los rangos percentiles correspondientes a cada una de las puntuaciones directas.

2. Asumiendo que la variable se distribuye normalmente, buscar en la tabla de la normal los valores z correspondientes a cada uno de los porcentajes.

Si por ejemplo, decimos que una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos de la muestra. Si asumimos que se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas, que en este caso equivale a 1.28: Zp=90=1.28.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

34


3. Escalas normalizadas derivadas (estaninos o eneatipos): las típicas normalizadas, presentan el inconveniente de los valores negativos y decimales. Ello, se puede superar mediante la transformación de las puntuaciones típicas normalizadas, a normalizadas derivadas.

Estaninos: son una escala de valores enteros y positivos de 9 unidades (1 al 9). Son una transformación lineal de las típicas normalizadas con media 5 y desviación típica 2.

E=5+2Zn

Si por ejemplo, una puntuación 40, equivale al percentil 90, estamos diciendo que deja por debajo al 90 % de los sujetos. Si se distribuye normalmente, podemos buscar su puntuación z asociada en las tablas, que en este caso equivale a 1.28: Zp=90=1.28.

E=5+2(1.28)=7.56 8

Inconveniente: se incluye en el mismo eneatipo a sujetos con la misma puntuación

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

35

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Normas cronológicas

Edad mental (Binet-Simon):

1. Se seleccionan muestras de niños de distinta edad.

2. Se les aplica un test (inteligencia por ejemplo).

3. A cada grupo de edad se le hace corresponder la media obtenida

Cociente intelectual:

1. Se calcula la edad mental del sujeto.

2. Se divide por su edad cronológica.

100EC

EMCI

<100 desarrollo intelectual por debajo del que corresponde con su edad.

=100 desarrollo intelectual y cronológico coinciden

>100 desarrollo intelectual por encima del cronológico

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

36

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Normas cronológicas

Inconvenientes:

El significado de un año de edad mental no es constante con el desarrollo evolutivo de un niño. A medida que se crece la distancia entre años disminuye y se homogeneíza el desarrollo cognitivo el CI es poco discriminativo entre adultos por ejemplo.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

37

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Establecimiento y tipo de normas

ESTABLECIMIENTO Y TIPO DE NORMAS:

Normas; son una descripción de la posición del sujeto respecto del grupo normativo.

- el grupo normativo debe ser representativo de la población y tener un tamaño adecuado para proporcionar estimadores seguros.

- el grupo normativo debe ser homogéneo (todos los sujetos sean miembros de la población objetivo).

- como datos normativos se presentan todos los estadísticos descriptivos. Y en cuanto al tipo de escalas la más habitual es el rango percentil.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

38

TRANSFORMACIÓN DE PUNTUACINES PARA LA INTERPRETACIÓN EN TEST NORMATIVOS. Establecimiento y tipo de normas

Tipos de normas:

- Normas nacionales: es el tipo más frecuente, y se basan en muestras representativas a nivel nacional.

- Normas locales: son normas basadas en sub-poblaciones definidas sobre unidades geográficas limitadas. Como por ejemplo comunidades autónomas.

- Normas de usuarios y normas de conveniencia: son normas basadas en las puntuaciones de los sujetos a los que se les administra el test durante un período de tiempo determinado, pero sin consideraciones de muestreo. Son muy habituales en los test utilizados en la selección de personal. O en muchas otras ocasiones se basan en grupos de sujetos que simplemente son accesibles al constructor del test.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

39

Equiparación de puntuaciones

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

40

EQUIPARACIÓN DE PUNTUACIONES

EQUIPARACIÓN DE PUNTUACIONES:

la equiparación de puntuaciones de dos o más formas de tests se refiere a establecer una correspondencia entre sus puntuaciones, de tal modo que las puntuaciones de cualquiera de ellos pueda expresarse en términos de las del otro. Es decir, se trata de encontrar una transformación que permita expresar las puntuaciones de un test Y como función de las unidades de otro test X:

Y*=f(X)¿Cuál sería la puntuación de Juan en el test Y, que mide inteligencia, habiendo obtenido una

puntuación de 70 en el test X (también de inteligencia)?

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

41

Condiciones de equiparación:

1. Que los tests midan el mismo constructo; y con la misma fiabilidad.

2. Que para cada grupo de examinados de idéntica aptitud, la distribución de frecuencias condicional sobre el test Y, después de la transformación (Y*), es la misma que la distribución de frecuencias condicional sobre el test X.

3. Invarianza poblacional; es decir, la transformación será la misma independientemente del grupo en el que se obtenga.

4. Simetría: la transformación es invertible, es decir los resultados serán los mismos obteniendo Y*=f(X); que X*=f(Y)

Es poco probable que se cumplan las cuatro condiciones. Y aunque en teoría es posible construir dos formas que midan el mismo constructo y sean igualmente fiables, es

improbable que lo sean en todos los niveles de aptitud.


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

42

Equiparación horizontal, frente a vertical: la equiparación horizontal hace referencia a que ambos tests son iguales en dificultad. Sin embargo, esto no siempre ocurre, y nos encontramos ante el problema de la equiparación vertical, es decir, cuando los test miden el mismo rasgo pero con distinto nivel de dificultad.


TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

43

EQUIPARACIÓN DE PUNTUACIONES. Diseños de equiparación

Diseños de equiparación:

- Diseños de un solo grupo: se administran las dos formas del test, al mismo grupo de sujetos (una tras otra).

- Inconveniente de que existan diferencias debido al cansancio, o al efecto del orden. Para evitarlo se puede utilizar diseños de un solo grupo contrabalanceado dividir a la muestra en dos sub-grupos y aplicar ambas formas pero en orden inverso.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

44


Diseños de equiparación

2. Diseños de grupos equivalentes: extraen de la población y de forma aleatoria dos muestras de sujetos, y a cada muestra se le aplica una forma del test. Es decir, las dos formas del test son administradas cada una a un grupo de sujetos.

- Ventaja; se evitan los efectos de la fatiga, aprendizaje u orden de aplicación.

- Inconveniente: ambos grupos han de ser equivalente en la aptitud que mide el test. Y requiere amplios tamaños muestrales.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

45


Diseños de equiparación

3. Diseños de grupos no equivalentes con ítems comunes o diseño de anclaje (es uno de los diseños más utilizados): En cada muestra de sujetos se administra solamente una forma del test, con la peculiaridad de que en ambas muestras se administra un test común (Z, test de anclaje), que permite establecer la equivalencia entre los test a equiparar.

- Test de anclaje interno: ítems comunes que aparecen intercalados entre el resto de ítems (se consideran en la puntuación total): ítems de anclaje.

- Test de anclaje externo: los ítems comunes aparecen formando un test independiente (no se consideran en la puntuación total) test de anclaje.

En cuanto al nº de ítems comunes; al menos el 20% del test total.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

46

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación

Métodos de equiparación: una vez obtenidos los datos mediante los diseños vistos anteriormente, es necesario obtener las puntuaciones mediante distintos métodos estadísticos.

1. Método de la media: se hace corresponder las medias de los test a equiparar. Sean X e Y dos tests distintos, para toda puntuación X podemos establecer que:

Donde:

X* es la puntuación del test Y, equivalente a una del test X.

X es la puntuación del test X.

es la media del test X e Y, respectivamente.

YX ;

YXXYX *

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

47

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método de la media

1. Supongamos dos test X e Y, cuyas medias son, respectivamente, 65 y 70. Un sujeto ha obtenido una puntuación de 60 puntos en el test X ¿qué puntuación le correspondería en el test Y?

Según los datos, un sujeto que en el test X ha obtenido una puntuación de 60, le correspondería una de 65 en el test Y.

655607065* XYX

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

48

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método lineal

Métodos de equiparación

2. Método lineal: se basa en la equiparación de aquellas puntuaciones directas que tienen la misma puntuación típica. Es decir, una determinada puntuación de Y, es equivalente a una de X, si ambas puntuaciones tienen idéntica puntuación Z, con lo que ZX= ZY

Donde:

X* es la puntuación del test Y, equivalente a una del test X.

X es la puntuación del test X.

es la media del test X e Y, respectivamente.

Sx y Sy es la desviación típica de X e Y respectivamente

YX ;

YXXS

SYXdespejando

S

YY

S

XX

X

Y

YX

)(*;

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

49

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método lineal

Si hubiéramos utilizado un diseño de un solo grupo, en el que se administran ambos test. La expresión sería la siguiente:

Por último, si hubiéramos utilizado un diseño de anclaje. La expresión sería la siguiente:

22*

2121

21

21YYXX

XSS

SSYX

XX

YY

)(())(()(

)(* 22112

122

12

22

222

2

ZZbYZZbXXSSbS

SSbSYX yzxz

zzxzx

zzyzy

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

50

EQUIPARACIÓN DE PUNTUACIONES. Métodos de equiparación. Método equipercentil

Métodos de equiparación

3. Método equipercentil: es el método más habitual, consiste en equiparar aquellas puntuaciones cuyos percentiles son iguales.

1. Calcular en cada test las puntuaciones percentiles que corresponden a cada una de las puntuaciones de ambos test.

2. Representar gráficamente las dos distribuciones de percentiles.

3. Obtener las puntuaciones equivalente en los dos test (X e Y) a partir del gráfico anterior.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

51


3. En la tabla adjunta se presentan las puntuaciones percentiles correspondientes a un grupo de sujetos en dos formas (X e Y) de un test de razonamiento compuesto por 10 ítems.Puntuación Percentil en X Percentil en Y

1 3 3

2 5 5

4 10 14

6 20 26

8 29 40

10 43 57

12 61 72

14 75 82

16 87 91

18 95 97

20 99 99

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

52


Representamos gráficamente ambas distribuciones:

0

20

40

60

80

100

120

1 2 4 6 8 10 12 14 16 18 20

puntuación directa

per

cen

til

Test X

Test Y

1. Eje de abscisas puntuaciones de X e Y; eje de ordenadas los percentiles.2. Representamos la curva correspondiente a cada test.3. Obtenemos las puntuaciones equivalentes en ambos tests.

- Observamos, que una X=10; le corresponde, aproximadamente, una puntuación equivalente X*=8. Este proceso se sigue con el resto de las puntuaciones.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

53

Documentación del test

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

54

ELABORACIÓN DE LA DOCUMENTACI´NO QUE ACOMPAÑA AL TEST.

EL MANUAL DEL TEST:

Existe la necesidad por parte del constructor del test de dar información a los usuarios para que puedan dar una significación adecuada a las puntuaciones obtenidas por un sujeto en el test ELABORACIÓN DEL MANUAL DEL TEST.

Para Yela (1984), la información a incluir sería la misma que la que se incluiría en un informe científico:

-Especificación del test.

-Descripción del test.

-La justificación.

-Referencias bibliográficas.

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

55

ELABORACIÓN DE LA DOCUMENTACIÓN QUE ACOMPAÑA AL TEST.

1. Especificación del test: denominación y clasificación del test (tipo de constructo que evalúa); tipo de material (impreso y manipulativo); y al método de administración (individual o colectiva).

2. Descripción del test:

2.1. Introducción donde se explique el objetivo del test; su relación con otros tests; y sus antecedentes y desarrollo del test.

2.2. Explicitar el campo de aplicación (aspectos psicológicos que se pretende estudiar).

2.3. Instrucciones de aplicación, y tiempos de los que se dispone para la ejecución de cada una de las partes.

2.4. Indicar la forma de puntuar, para ello, se incluirán plantillas con soluciones; así como ejemplos comentados.

3. La justificación: incluye los datos cuantitativos que justifican el uso del test (fiabilidad, validez y tipificación del test).

4. Referencias bibliográficas.

Ejemplo: manual BFQ-NEjemplo: manual BFQ-N

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

56

VALORACIÓN DE LA TEORIA CLÁSICA DE LOS TEST

VALORACIÓN DE LA TCT:

Los procedimientos vistos se han desarrollado bajo la TCT, que ha sido y sigue siendo uno de los modelos psicométricos mas influyentes dentro del campo de la medición en Psicología.

- Ventajas:

Sencillez, claridad y flexibilidad de sus conceptos

Partiendo de supuestos mínimos, proporciona solución a una gama amplia de problemas de medición.

- Limitaciones:

Los supuestos no se pueden comprobar empíricamente

El supuesto de error de medida constante para los diferentes nivel de habilidad es poco plausible

Las propiedades del test y las puntuaciones de los sujetos no son invariantes.

Concepción indiferenciada del error de medida

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

57

A MODO DE SÍNTESIS

-Fiabilidad, validez, y análisis de ítems Evaluación de los sujetos

1. Asignación de puntuaciones (azar y omisiones).

- Créditos para el conocimiento parcial (ponderación de confianza; responder hasta acertar; ponderación de las opciones).

2. Interpretación de las puntuaciones (TRN; y TRC)

3. TRC, y establecimiento de puntos de corte:

-Métodos centrados en el test (ítem como unidad de análisis).

-Métodos centrados en las personas.

-Métodos de compromiso.

4. TRN, y transformación de puntuaciones:

- Lineales (típicas; y típicas derivadas).

- No-lineales (percentiles; típicas normalizadas; normalizadas derivadas)

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

58

5. Equiparación de puntuaciones.

-Diseños: un solo grupo; grupos equivalentes; y anclaje.

-Métodos: media; lineal; equipercentil.

6. Manual del test: especificación; descripción; justificación; y bibliografía.

7. Valoración de la TCT: ventajas, y limitaciones.

A MODO DE SÍNTESIS

TEM

A 7

: B

AR

EM

AC

IÓN

ES

TA

ND

AR

IZA

CIÓ

N E

QU

IPA

RA

CIÓ

N

PU

NTU

AC

ION

ES

59

1. Barbero, I., García, E. Vila, E., y Holgado, F.P. (2010). Psicometría: Problemas resueltos. Madrid: Sanz y Torres.Se trata de un libro de ejercicios y problemas en el que se incluye el desarrollo de la solución. El alumno podrá completar desde un punto de vista aplicado los conceptos y contenidos vistos en la parte teórica; así como adquirir las destrezas necesarias para la resolución de problemas.2. Barbero, I. (Coord.) , Vila, E. y Holgado, F.P. (2010). Psicometría. Madrid: Sanz y Torres.El capítulo 9 puede servir para preparar los contenidos relacionados con la asignación y transformación de puntuaciones.3.Martínez Arias, R. (1995). Psicometría: Teoría de los Tests Psicológicos y Educativos. Madrid: Síntesis. En el Cap. 20 se tratan los principales aspectos relacionados la asignación de puntuaciones, sus transformaciones; y presenta los principales procedimientos de equiparación. Todo ello está ejemplificado abundantemente.

BIBLIOGRAFÍA COMENTADA

N I PSICOMETRÍA - us

Documents

Transcript of N I PSICOMETRÍA - us