Proyecto:

Análisis y Predicción de la Rotación de Personal

Un enfoque basado en datos para mejorar la retención de talento

Rotación de Personal

Problema de Negocio

Problema
de Negocio

Una empresa enfrenta una elevada rotación de personal, lo que conlleva una pérdida sostenida de talento clave y un impacto directo en la continuidad operativa de sus procesos críticos. Esta situación se traduce en costos significativos asociados a los procesos de reemplazo, incluyendo la búsqueda, selección y contratación de nuevos colaboradores, así como su posterior capacitación, inducción y curva de aprendizaje.

Adicionalmente, la salida recurrente de empleados con conocimiento específico del negocio genera una pérdida de capital intelectual, afecta la transferencia de conocimiento interno y aumenta la dependencia de recursos menos experimentados. Durante el período de transición —comprendido entre la desvinculación del colaborador y el momento en que su reemplazo alcanza un nivel de desempeño equivalente— se observa una disminución de la productividad, un aumento en la carga operativa del equipo restante y un mayor riesgo de errores operacionales.

En el mediano y largo plazo, una alta rotación de personal puede deteriorar el clima organizacional, afectar el compromiso de los equipos y debilitar la marca empleadora, dificultando la atracción de talento calificado. En conjunto, estos factores impactan negativamente en la eficiencia operativa, los resultados financieros y la capacidad de la organización para sostener su crecimiento y competitividad.

En ausencia de un enfoque basado en datos, la gestión de la rotación de personal suele abordarse de manera reactiva y fragmentada. Las decisiones se toman principalmente a partir de percepciones subjetivas, experiencia individual de las jefaturas o análisis agregados de rotación histórica, sin profundizar en las causas subyacentes ni en los factores que incrementan el riesgo de salida de determinados perfiles. Las entrevistas de salida, cuando existen, rara vez se sistematizan o integran con información histórica del colaborador, lo que limita su utilidad analítica.

Como resultado, las acciones implementadas tienden a ser generales y poco focalizadas —como ajustes salariales transversales o beneficios estándar— sin una evaluación clara de su efectividad ni una priorización del talento crítico. Esta falta de visibilidad impide anticipar salidas, identificar patrones de rotación y optimizar la asignación de recursos, perpetuando un ciclo de alta rotación con elevados costos operativos y bajo aprendizaje organizacional.

Rotación de Personal

Objetivos
del Proyecto

Objetivo General:

Desarrollar una solución analítica integral que permita comprender, anticipar y gestionar la rotación de personal, transformando los datos en información accionable para la toma de decisiones estratégicas.

Objetivos Específicos:

Entender y Cuantificar el Problema

Analizar los datos históricos para cuantificar el impacto de la rotación de personal e identificar los perfiles que más renuncian.

Desarrollar un Sistema Predictivo

Implementar un modelo predictivo de machine learning que permita anticipar salidas y priorizar acciones de retención.

Diseñar un Dashboard Ejecutivo

Proveer una herramienta de visualización que facilite el monitoreo y la toma de decisiones estratégicas.

Rotación de Personal

Tecnologías Aplicadas

Python

Lenguaje principal para el análisis de datos y el desarrollo del proyecto.

Numpy

Operaciones numéricas y soporte para cálculos vectorizados.

pandas

Pandas

Manipulación, limpieza y transformación de datos tabulares.

Matplotlib

Generación de gráficos para análisis de variables y validación de patrones.

scikit

Scikit-Learn

Preparación de datos y desarrollo de modelos de machine learning.

Tableau

Construcción de dashboards interactivos orientados a la toma de decisiones.

Rotación de Personal

Preguntas de Negocio

Preguntas
de Negocio

El planteamiento de preguntas de negocio permite estructurar el análisis, definir el foco del proyecto y asegurar que el uso de datos esté orientado a la toma de decisiones. Este ejercicio actúa como nexo entre el problema identificado y las soluciones analíticas desarrolladas a lo largo del proyecto.

1. ¿Cuál es la tasa de rotación de personal dentro de la empresa?

2. ¿Existen perfiles de empleados con mayor probabilidad de abandonar la organización?

3. ¿Cuál es el impacto económico de la rotación de personal?

4. ¿Cuál ha sido el costo económico de la rotación durante el último año?

5. ¿Cuál es el costo asociado a bajos niveles de compromiso o motivación?

6. ¿Qué ahorro potencial podría lograrse optimizando las estrategias de retención?

Rotación de Personal

Conjunto de Datos

Los datos utilizados en este proyecto fueron proporcionados por la empresa y corresponden a información interna del área de recursos humanos, recopilada a partir de sus sistemas y procesos de gestión de personal. El conjunto de datos está compuesto por 1470 registros, correspondientes a empleados de la empresa, cuyas variables se describen más adelante. El archivo original puede consultarse haciendo clic en el botón inferior.

Variables:

Rotación de Personal

Análisis Exploratorio
y Preparación de los Datos

Análisis Exploratorio
y Preparación de
los Datos

Se realizó un análisis exploratorio inicial con el objetivo de evaluar la calidad de los datos, identificar inconsistencias evidentes y tomar decisiones de preparación que permitieran avanzar con el modelado y el análisis de negocio de forma consistente y fundamentada. El detalle completo del procedimiento puede revisarse en el archivo notebook asociado mediante el botón inferior.

Análisis de Calidad de Datos

Durante el análisis de calidad de los datos se identificó la presencia de valores nulos en algunas variables. En función de la proporción de datos faltantes y de su relevancia para el análisis, se decidió eliminar aquellas variables con un nivel de incompletitud elevado, mientras que en otros casos se aplicaron estrategias de imputación con el fin de preservar información relevante y mantener la consistencia del conjunto de datos.

Decisiones sobre las Variables:

Análisis Exploratorio de Variables Categóricas

El análisis exploratorio de las variables categóricas permitió identificar una variable con un único valor posible, la cual fue eliminada por no aportar información relevante al análisis. Asimismo, mediante el uso de gráficos exploratorios se analizaron las distribuciones de las categorías, lo que facilitó la identificación del valor más probable para la imputación de los valores nulos previamente detectados.

Decisiones sobre las Variables:

Análisis Exploratorio de Variables Numéricas

El análisis exploratorio de las variables numéricas, mediante el cálculo de estadísticos descriptivos, permitió identificar algunas variables con un único valor, las cuales fueron eliminadas por no aportar información relevante. Adicionalmente, se detectó una variable con valores fuera del rango lógicamente posible, lo que evidenció una inconsistencia en los datos y motivó su eliminación.

Decisiones sobre las Variables:

Rotación de Personal

Generación de Insights

Generación
de Insights

En esta sección se presentan los principales insights obtenidos a partir del análisis de los datos, dando respuesta a las preguntas de negocio planteadas previamente. Se recuerda que el proceso detallado se puede revisar en el archivo notebook.

1. ¿Cuál es la tasa de rotación de personal dentro de la empresa?

La tasa de rotación de personal se calculó en un 16,12% del total de empleados en la empresa.

A partir del análisis realizado, se constató que efectivamente existe un perfil de empleado con mayor propensión a abandonar la organización. Este perfil se caracteriza, de manera predominante, por presentar:

 

— un nivel educativo más bajo

— estado civil soltero

— pertenencia al departamento de ventas

— un nivel salarial reducido

— la realización habitual de horas extra

Según el estudio “Cost of Turnover” del Center for American Progress:

 

— El coste de la fuga de los empleados que ganan menos de $30.000 dólares anuales es del 16,1% de su salario.
— El coste de la fuga de los empleados que ganan entre $30.000 y $50.000 dólares anuales es del 19,7% de su salario.
— El coste de la fuga de los empleados que ganan entre $50.000 y $75.000 dólares anuales es del 20,4% de su salario.
— El coste de la fuga de los empleados que ganan más de $75.000 dólares anuales es del 21% de su salario.

 

Con esta información, se crearon 2 nuevas variables en el dataset:

 

— salario_anual: es igual al salario mensual (salario_mes) multiplicado por 12.

— impacto_abandono: es igual al salario anual (salario_anual) multiplicado por el porcentaje correspondiente que indica el estudio antes mencionado. Esta variable refleja el coste estimado de que dicho empleado abandone la empresa.

El costo económico de la rotación en el último año se eleva hasta los $2.719.005 USD.

Los bajos niveles de compromiso o motivación, es decir, empleados cuya implicacion = “Baja”, generan costos asociados de $368.673 USD.

— Reducir en un 10% la fuga de empleados supondría un ahorro potencial de hasta $271.900 USD cada año.

 

— Reducir en un 20% la fuga de empleados supondría un ahorro potencial de hasta $543.801 USD cada año.

 

— Reducir en un 30% la fuga de empleados supondría un ahorro potencial de hasta $815.701 USD cada año.

Rotación de Personal

Modelo Predictivo:
Árbol de Decisión

Para el desarrollo del modelo predictivo de renuncias se utilizó un árbol de decisión (decision tree), una técnica de machine learning ampliamente utilizada por su simplicidad conceptual y facilidad de interpretación. Un árbol de decisión funciona de manera similar a un proceso de toma de decisiones humano: a partir de una serie de preguntas secuenciales sobre las características de los empleados, el modelo va dividiendo los casos en distintos grupos hasta llegar a una predicción final.

Cada “rama” del árbol representa una condición o regla basada en los datos, mientras que cada “nodo final” indica la probabilidad de que un empleado abandone la organización. Este enfoque permite entender con claridad qué factores influyen en la predicción y cómo se combinan entre sí, lo que resulta especialmente valioso en contextos de negocio donde la transparencia y la explicabilidad son fundamentales. Además, esta estructura facilita la identificación de variables críticas y umbrales relevantes que pueden ser abordados mediante acciones de gestión concretas.

Si bien existen modelos más complejos que pueden alcanzar mayores niveles de precisión, muchos de ellos funcionan como una “caja negra”, dificultando la interpretación de sus resultados. En este proyecto se priorizó un modelo que permita traducir las predicciones en criterios comprensibles y accionables, facilitando su uso como herramienta de apoyo a la toma de decisiones por parte de áreas no técnicas, y favoreciendo su utilización práctica en el contexto organizacional.

Rotación de Personal

Preprocesamiento de Datos
para Machine Learning

Preprocesamiento
de Datos para
Machine Learning

Antes de entrenar el modelo de árbol de decisión, fue necesario preparar el conjunto de datos de acuerdo con ciertos requisitos básicos del algoritmo. En particular, este tipo de modelo requiere trabajar con datos completos —sin valores nulos— y con variables expresadas en formato numérico. La identificación y tratamiento de valores faltantes fue abordada en etapas anteriores del análisis, mientras que en esta sección se describen las transformaciones adicionales necesarias para el modelado.

Transformación de Variables Categóricas (One-Hot Encoding)

Dado que el conjunto de datos contiene variables categóricas (por ejemplo, departamento o nivel educativo), fue necesario transformarlas a un formato numérico para que pudieran ser interpretadas por el modelo. Para ello se utilizó una técnica conocida como one-hot encoding, que consiste en convertir cada categoría en una nueva variable binaria que indica la presencia o ausencia de dicha categoría. De esta forma, la información original se conserva, pero en un formato que el modelo puede procesar correctamente.

Definición de Variables Independientes y Variable Objetivo

Una vez transformados los datos, el conjunto se separó en dos partes: las variables independientes, que contienen la información utilizada para realizar las predicciones, y la variable dependiente u objetivo, denominada abandono, que indica si un empleado dejó o no la organización. Esta separación responde a la lógica básica del aprendizaje supervisado, donde el modelo aprende a identificar patrones en las variables independientes para predecir el valor de la variable objetivo.

División del Conjunto de Datos en Entrenamiento y Prueba

Finalmente, el conjunto de datos fue dividido en un subconjunto de entrenamiento y otro de prueba. El primero se utiliza para entrenar el modelo y aprender los patrones presentes en los datos, mientras que el segundo permite evaluar su desempeño sobre información no vista previamente. Esta separación es fundamental para medir de forma objetiva la capacidad del modelo de generalizar y evitar conclusiones basadas únicamente en su rendimiento sobre los datos con los que fue entrenado.

Rotación de Personal

Entrenamiento
y Validación

Entrenamiento del Modelo

El entrenamiento del modelo consiste en exponer el árbol de decisión al conjunto de datos de entrenamiento, permitiéndole aprender patrones y relaciones entre las variables disponibles y la variable objetivo (abandono). Durante este proceso, el modelo identifica qué características resultan más útiles para separar a los empleados que abandonan la organización de aquellos que permanecen, construyendo de forma automática las reglas y divisiones que conforman el árbol.

Validación del Modelo

Una vez entrenado, el desempeño del modelo se evaluó utilizando el conjunto de datos de prueba, el cual no fue utilizado durante el entrenamiento. Esta validación permite medir qué tan bien el modelo es capaz de generalizar sus predicciones a datos nuevos. Para ello se utilizó la métrica ROC AUC, que evalúa la capacidad del modelo para distinguir entre empleados que abandonan y empleados que no lo hacen. El modelo obtuvo un valor de ROC AUC = 0,72, lo que indica un desempeño adecuado y superior al azar, sugiriendo que el modelo es capaz de identificar patrones relevantes asociados al riesgo de renuncia. Este resultado valida el uso del modelo como una herramienta de apoyo al análisis y a la toma de decisiones, sin perder de vista que su objetivo es complementar el criterio humano y no reemplazarlo.

Rotación de Personal

Interpretación del Modelo

Interpretación
del Modelo

La visualización del árbol de decisión permite comprender de forma clara cómo el modelo estructura el proceso de predicción del abandono. En el nodo inicial se observa que la variable años de experiencia es el primer criterio de segmentación, lo que indica que este factor es el más relevante para diferenciar el comportamiento de los empleados respecto a la probabilidad de renuncia.

A partir de esta primera división, el modelo sigue distintos caminos combinando variables como el estado civil, las horas extra, el salario, el número de empresas anteriores y el nivel de satisfacción. Cada una de estas ramas representa una regla específica que agrupa a empleados con características similares y niveles de riesgo de abandono distintos. Por ejemplo, en perfiles con menor experiencia, el modelo da mayor peso a variables asociadas a carga laboral y satisfacción, mientras que en perfiles con mayor experiencia aparecen factores vinculados a trayectoria profesional y compensación.

Los nodos finales del árbol muestran la proporción de empleados que abandonan y los que permanecen en la organización dentro de cada grupo, lo que permite identificar segmentos con riesgo particularmente alto o bajo. Esta estructura facilita no solo la predicción, sino también la interpretación de los resultados, ya que cada decisión del modelo puede traducirse en reglas comprensibles y accionables, útiles para diseñar estrategias de retención específicas según el perfil del empleado.

Reglas Clave Identificadas por el Modelo:

Baja Experiencia y Alta Carga Laboral

Los empleados con pocos años de experiencia que además realizan horas extra presentan una mayor probabilidad de abandono, especialmente cuando este escenario se combina con niveles bajos de satisfacción. Este patrón sugiere riesgo de desgaste temprano o desalineación entre expectativas y carga de trabajo.

Insatisfacción: Factor Transversal de Riesgo

Independientemente de la antigüedad, los niveles bajos de satisfacción aparecen de forma recurrente en ramas asociadas a mayor abandono. Esto indica que la satisfacción actúa como un factor crítico que amplifica el riesgo cuando se combina con otras condiciones desfavorables.

Alta Experiencia con Baja Compensación

En empleados con mayor experiencia, el riesgo de renuncia aumenta cuando el salario se sitúa en rangos bajos en relación con su trayectoria. Este comportamiento sugiere posibles brechas de reconocimiento, desarrollo profesional o competitividad salarial frente al mercado.

Trayectorias Laborales Inestables

Los empleados con historial de múltiples empleadores previos muestran una mayor propensión al abandono, especialmente cuando se combina con menor satisfacción o escasa permanencia en la empresa actual. Este patrón puede reflejar perfiles con mayor movilidad o menor vinculación organizacional.

Rotación de Personal

Cuantificación Económica
del Riesgo de Abandono

Cuantificación Económica del Riesgo de Abandono

Una vez entrenado y validado el modelo, se utilizó para estimar un scoring de abandono para cada empleado, el cual representa la probabilidad de que ese colaborador renuncie a la empresa según sus características actuales. Este indicador permite identificar y priorizar casos con mayor riesgo relativo de salida.

scoring_abandono: probabilidad según el modelo de que el empleado renuncie.

Adicionalmente, con el objetivo de traducir este riesgo en términos económicos, se calculó un scoring de riesgo, definido como el producto entre la probabilidad de abandono y el costo estimado de reemplazo de cada empleado. Este indicador busca dimensionar el impacto económico esperado de una posible renuncia, combinando tanto la probabilidad de ocurrencia como el costo asociado, y permite enfocar las acciones de retención en aquellos casos donde el riesgo financiero es mayor.

scoring_riesgo = scoring_abandono x impacto_abandono (costo esperado)

El archivo final con estas variables calculadas puede descargarse desde el botón inferior.

Rotación de Personal

Dashboard Ejecutivo

Con el objetivo de facilitar la interpretación de los resultados y apoyar la toma de decisiones, se diseñó un dashboard ejecutivo que consolida la información generada a partir del análisis exploratorio y del modelo predictivo. Este panel permite visualizar de manera resumida el nivel de riesgo de abandono de la organización, así como su impacto económico potencial, habilitando una lectura rápida y accionable para perfiles directivos.

 

El dashboard incluye indicadores clave como la tasa de rotación, la cantidad de empleados en riesgo —definidos como aquellos con una probabilidad de renuncia superior al 50%— y el costo económico esperado asociado a posibles salidas. Complementariamente, se incorporan visualizaciones que permiten profundizar en el análisis, como un gráfico de bigotes que muestra la distribución del riesgo de abandono por puesto y una tabla de empleados críticos priorizada según su impacto económico. En la esquina superior derecha se dispone de un segmentador por departamento, que permite focalizar el análisis y explorar el riesgo de forma específica en distintas áreas de la organización.

Rotación de Personal

Conclusiones y Recomendaciones

Esta sección presenta una síntesis de los principales patrones identificados por el modelo predictivo de abandono, a partir del análisis del árbol de decisión y de las variables con mayor poder explicativo, tales como la experiencia, la carga laboral, la satisfacción, la compensación y el historial laboral. Sobre la base de estos resultados, se proponen recomendaciones orientadas a intervenir de manera focalizada sobre los factores de riesgo detectados, con el objetivo de reducir la probabilidad de renuncia en distintos perfiles de empleados y definir acciones concretas de retención.

Hallazgo del Modelo

 

Empleados con pocos años de experiencia que realizan horas extra muestran mayor probabilidad de renuncia, especialmente cuando la satisfacción es baja.

 

Acciones Sugeridas

  • Ajustar la carga laboral durante los primeros meses.
  • Implementar programas de acompañamiento o mentoría temprana.
  • Monitorear de forma proactiva el bienestar de nuevos colaboradores.
  • Revisar expectativas del rol durante el proceso de onboarding.

Hallazgo del Modelo

 

La satisfacción aparece de forma recurrente como un nodo clave asociado al abandono, amplificando otros factores de riesgo.

 

Acciones Sugeridas

  • Implementar encuestas de clima y satisfacción con mayor frecuencia.
  • Diseñar planes de acción específicos para áreas o equipos con baja satisfacción.
  • Fortalecer instancias de feedback y comunicación con líderes directos.
  • Incorporar métricas de satisfacción como indicadores tempranos de riesgo.

Hallazgo del Modelo


Colaboradores con mayor experiencia y salarios relativamente bajos presentan mayor propensión al abandono.


Acciones Sugeridas

  • Realizar benchmark salarial por nivel de experiencia y rol.

  • Evaluar planes de progresión salarial y desarrollo de carrera.

  • Reforzar mecanismos de reconocimiento no monetario cuando los ajustes inmediatos no sean posibles.

  • Identificar perfiles críticos con alto impacto en el negocio.

Hallazgo del Modelo


Empleados con varios empleadores previos muestran mayor riesgo de abandono, especialmente cuando la satisfacción es baja.


Acciones Sugeridas

  • Diseñar estrategias de retención personalizada para perfiles de alta movilidad.

  • Reforzar el sentido de pertenencia mediante objetivos claros y planes de desarrollo.

  • Asegurar una correcta alineación cultural desde el proceso de selección.

  • Realizar seguimientos periódicos en los primeros ciclos de evaluación.

En conjunto, el proyecto aborda el problema de la rotación de personal desde una perspectiva integral, recorriendo todas las etapas del proceso analítico: exploración y preparación de los datos, análisis de negocio, modelación predictiva, cuantificación del riesgo y visualización ejecutiva. De este modo, se demuestra cómo el uso de técnicas de data science puede transformar datos históricos en insights accionables y recomendaciones de negocio que apoyen la toma de decisiones estratégicas.

Scroll to Top