Los métodos de evaluación, como las pruebas de capacidad, los cuestionarios de personalidad o integridad, las entrevistas personales y los centros de evaluación, son buenos predictores del rendimiento y pueden mejorar el rendimiento de la inversión (ROI) de los procesos de contratación. Sin embargo, éstos tienen un costo.

¿No sería estupendo que se pudiera aplicar un enfoque cuantitativo para calcular el ROI al elegir métodos de selección costosos y decidir cuántas personas incluir en cada etapa de la selección?

La buena noticia es que tal enfoque existe y hace uso de un método pensado por dos científicos americanos, Taylor y Russell. En 1939, exploraron cómo calcular la efectividad de las pruebas y evaluaciones de selección en el lugar de trabajo.

¿Cómo podemos usar la validez predictiva?

Décadas después del documento de Taylor y Russell, un documento de trabajo de Schmidt, Oh y Shaffer (2016) reporta nuevas y más precisas relaciones entre los métodos de evaluación y los resultados de rendimiento. Los autores presentan relaciones lineales entre los métodos de evaluación y el rendimiento. Esto significa que, al examinar numerosos estudios sobre el rendimiento y los métodos de selección, han desarrollado un método que muestra que un aumento de la puntuación de la evaluación produce un aumento proporcional del rendimiento, como ilustran los dos gráficos siguientes:

Cuando la validez predictiva (medida por el valor «r») es alta, la relación entre el rendimiento y las puntuaciones de la prueba es más parecida a la del Gráfico A, con los participantes reunidos alrededor de una línea ideal que representa nuestro modelo.

El problema para muchos profesionales es que esta información parece difícil de poner en práctica. ¿Qué significa un valor r de (por ejemplo) .65?

¿Significa que el 65% de los seleccionados serán buenos empleados? ¿La gente del 65 por ciento serán buenos empleados? ¿O tenemos un 65% más de buenos empleados usando el test? La respuesta a todas esas preguntas es no. Lo que realmente sucede es un poco más complicado y necesita más explicaciones. Volvamos a nuestro modelo lineal.

Lo que hacemos cuando establecemos un punto de referencia mínimo es seleccionar sólo a aquellos candidatos cuya puntuación en el test es superior a un determinado valor. Podemos representar este punto de referencia como una línea vertical recta.

Todos los candidatos representados por puntos a la derecha de la línea pasarán a la siguiente etapa. Todos los candidatos representados por puntos a la izquierda serán excluidos. Podemos ver que si movemos la línea a la derecha (aumentando el punto de referencia) habrá menos candidatos aprobados.

Esto hace que sea mucho más claro saber lo que estamos haciendo cuando establecemos un punto de referencia, pero todavía no nos da mucha información sobre la calidad de los candidatos seleccionados. La razón de esto es que necesitamos un elemento más: la tasa de base.

La tasa base es la indicación de cuántos de los candidatos son apropiados para el trabajo. Gráficamente se puede representar como una línea recta horizontal. Todos los candidatos que caen por debajo de la línea son de bajo rendimiento y todos los candidatos colocados por encima de la línea son de buen rendimiento. Es obvio que si todos (o la mayoría) de los candidatos son adecuados para el puesto, no sería necesario un proceso de selección ya que, independientemente de ello, se seleccionarían los que tuvieran un buen rendimiento.

En el ejemplo que se presenta a continuación, aproximadamente el 50% de los candidatos serían adecuados (los que están por encima de la línea horizontal). Pero aplicando nuestro puntaje de referencia de selección al gráfico de abajo (la línea vertical), podemos refinar nuestra reserva de candidatos. Podemos ver que entonces seleccionaríamos hasta la siguiente etapa cinco buenos candidatos y sólo tres malos (es decir, el 62,5%).

El enfoque de Taylor Russell

Para poder utilizar el marco conceptual explicado anteriormente, necesitamos un modelo matemático. Afortunadamente, Taylor y Russell (1939) crearon un modelo muy práctico para ayudar a identificar cuántos buenos candidatos se seleccionarán conociendo lo siguiente: tasa base, validez del instrumento de selección y punto de referencia (en percentil). Crearon las famosas tablas que se pueden encontrar en su artículo al que se hace referencia más adelante (véase la figura 1).

Para usar las tablas, hay que seguir un proceso de tres pasos.

  1. Conocer la tasa base (proporción de empleados considerados adecuados). Para utilizar las tablas, primero debe conocer la tasa base. Hay 10 tablas, una para cada valor del tipo base del 5% (.05) al 95% (.95). Seleccione la tabla que sea más apropiada para el puesto de trabajo.
  2. Entienda la validez de su instrumento. Luego, considere la validez de su instrumento. Según las últimas actualizaciones de Schmidt, Oh y Schaffer (2016), el uso de pruebas de habilidad tiene una media r de 0,65, la entrevista de alrededor de 0,55 y la combinación de ambos tiene un indicador de validez igual a: .75. Tienes que hacer coincidir tu valor de r con la fila de la tabla de Taylor-Russell.
  3. Coincide con tu indicador de referencia. El punto de referencia (en percentil) debe coincidir con las columnas de la tabla.

La tabla te proporcionará cuántos de los empleados seleccionados tendrán un buen rendimiento o el verdadero positivo (T+). Este número también se llama la «sensibilidad» de su instrumento. Para saber el porcentaje de los falsos positivos (personas seleccionadas que no tienen un buen desempeño), puedes mirar 1-T+. El trabajo de Russell y Taylor fue significativo para avanzar en nuestra posibilidad de calcular el retorno de la inversión de la evaluación.

Estudio de caso ficticio: Los Choferes de Minería

Una minería internacional está comenzando una campaña de reclutamiento para contratar a 100 nuevos choferes para su nueva faena.

El trabajo en sí es relativamente simple – y la mayoría de los candidatos con competencias básicas (licencia, cuarto medio, responsable) podrían ser adecuados para el trabajo. La compañía ha calculado que alrededor del 80% de su grupo de candidatos podría ser un buen chofer después de un período de formación de 3 meses. Sin embargo, han tenido malas experiencias en el pasado con personas poco confiables que han sido encontradas borrachas en el trabajo o causando accidentes. La compañía ha calculado que en promedio, cada una de esas contrataciones problemáticas le ha costado a la compañía alrededor de 3 Millones $. La empresa ha recibido 500 CVs para este puesto y ha estado en contacto con una consultoría de RRHH que ha propuesto tres paquetes diferentes para evaluar a las personas, con diferentes precios y validez.

La pregunta es, ¿qué cotización, si es que hay alguno, debería elegir la empresa?

Procedimiento

Para resolver el problema, necesitamos usar las tablas de Taylor-Russell tres veces (una por cada paquete) para ver cuántos empleados «buenos» serán seleccionados. Calcularemos la tasa de falsos positivos (F+) que esperamos usando cada método. Esto será igual a 1 menos el número que encontramos en la tabla de Taylor-Russell.

1. Tasa base: Esto es 0.8 para todos las cotizaciones

2. Punto de referencia: Esto es igual a los candidatos seleccionados/total de candidatos = 100/500, por lo que 0.2 (para todos los paquetes)

3. Validez: Diferente por cada paquete ofrecido (.25,.45,.65)

  1. No se compró ningún paquete (P0)
  1. F + (P0 – No se ha comprado ningún paquete) = 1 – 0.8= 0.2
  2. La validez en este caso es igual a cero. Por lo tanto, el número de trabajadores de bajo rendimiento seleccionados consistirá en el mismo porcentaje que en la población general, igual a 1 – 0.8 (empleados satisfactorios) = 0.2
  1. Paquete 1 comprado (P1)
    1. F+(P1) = 1 – 0.89= 0.11
    2. La tasa base de los empleados adecuados es de 0,8. Por lo tanto, deberíamos echar un vistazo a la novena tabla del artículo de Taylor y Russell. La tasa de selección es .20 (1 de cada 5 candidatos es contratado) y la validez predictiva es .25. Podemos entonces usar estos 2 valores en la tabla para encontrar el alcance de los verdaderos positivos: .89. El falso positivo será el resto de los empleados seleccionados = 1 – 0.89 =  0.11 (11%)
  2. Paquete 2 comprado (P2)
    1. F + (P2) = 1 – 0.95= 0.05
    2. Todo aquí es igual, excepto que la validez predictiva es de 0,45. Por lo tanto, la coincidencia correcta es .95 y esto representa la proporción de verdaderos positivos. Los falsos positivos serán 1 – 0.95, =  0.05
  3. Paquete 3 comprado (P3)
    1. F + (P3)= 1 – 0.98= 0.02
    2. De nuevo, la validez predictiva es lo único que cambia y sube a 0,65. La nueva coincidencia es .98, y por lo tanto los falsos positivos serán 1 – 0.98= 0.02

Ahora necesitamos calcular el costo esperado de cada una de estas opciones. El costo esperado (CE) es: Coste de selección + Coste por malas contrataciones * número de malas contrataciones (falso positivos).

No hay paquete: Costo (P0) = 0 + 3 M$ * 20 = 60 M$

Paquete 1: Costo (P1) = 10 M$  + 3 M$ * 11 = 43 M$

Paquete 2: Costo (P2) = 20 M$ + 3 M$ * 5 = 35 M$

Paquete 3: Costo (P3) = 25 M$ + 3 M$ * 2 = 31 M$

El resultado

El mejor paquete que ofrece la Consultora de RRHH es el tercero (Test cognitiva mas integridad online + entrevista estructurada).

Se espera que el costo total de las contrataciones con este procedimiento sea de 31 M$. La Minera podría potencialmente ahorrar alrededor de 29 M$, en vez de los 60 M$ perdidos si no hubiera utilizado ningún procedimiento de selección.

Takeaways: A raíz de sencillas tablas de Russel Taylor se puede calcular el ROI para un proceso de selección y usar métodos de validez alta en la selección. Con este se puede mostrar el valor agregado que tienen métodos más válidos y el ahorro que tienen métodos modernos en las etapas de selección.

References:

Taylor, H. C. & Russell, J. T. (1939). The relationship of validity coefficients to the practical effectiveness of tests in selection: discussion and tables. Journal of Applied Psychology, 23(5), 565.

Schmidt, F. L., Oh, I. S. & Shaffer, J. A. (2016). The Validity and Utility of Selection Methods in Personnel Psychology: Practical and Theoretical Implications of 100 Years of Research Findings.