Por Canuto  

Un repositorio publicado en GitHub transformó datos oficiales del mercado laboral de Estados Unidos en una visualización interactiva que estima qué tan expuesta está cada ocupación a la inteligencia artificial. El proyecto analiza 342 profesiones, combina estadísticas de empleo con evaluación hecha por un modelo de lenguaje y ofrece una mirada útil para entender qué trabajos podrían cambiar más rápido con la automatización.
***

  • El proyecto usa datos del Manual de Perspectivas Ocupacionales de la Oficina de Estadísticas Laborales de EE. UU. para analizar 342 ocupaciones.
  • Cada empleo recibe una puntuación de exposición a la IA de 0 a 10, basada en automatización directa y en aumentos de productividad.
  • La media general del conjunto es 5,3 sobre 10, con desarrolladores, editores y paralegales entre los más expuestos.

La inteligencia artificial se ha convertido en una variable central para evaluar el futuro del trabajo. En ese contexto, un repositorio publicado por Josh Kale en GitHub propone una forma concreta de medir ese impacto sobre el mercado laboral de Estados Unidos, a partir de datos oficiales de la Oficina de Estadísticas Laborales, conocida como BLS por sus siglas en inglés.

El proyecto toma como base el Manual de Perspectivas Ocupacionales del BLS, una referencia ampliamente utilizada para seguir la evolución de profesiones, salarios, requisitos educativos y proyecciones de empleo. A partir de esa fuente, el autor recopiló información de 342 ocupaciones de distintos sectores de la economía estadounidense y las convirtió en una base estructurada para análisis posterior.

La propuesta no se limita a reunir datos públicos. También incorpora una capa de evaluación con inteligencia artificial para estimar cuán susceptible es cada ocupación a cambios impulsados por IA y automatización. El resultado final es una visualización tipo treemap, donde el tamaño de cada bloque representa empleo y el color refleja el nivel de exposición.

Para lectores que siguen de cerca la relación entre tecnología, productividad y mercados, este tipo de herramientas ofrece una señal relevante. No se trata solo de identificar qué puestos pueden ser automatizados, sino de observar qué segmentos laborales podrían cambiar si la IA permite a menos personas producir mucho más.

Cómo se construyó la base de datos

Según detalla el repositorio GitHub – JoshKale/jobs · GitHub, el flujo de trabajo parte con una etapa de raspado automatizado. Mediante Playwright, ejecutado en modo sin cabeza, el sistema descarga el HTML crudo de las 342 páginas de ocupaciones del BLS y las almacena en un directorio local. El uso de esta herramienta responde a que el sitio del BLS bloquea bots convencionales.

Después de esa fase, el proyecto procesa el contenido con BeautifulSoup. El HTML descargado se transforma en archivos Markdown más limpios y fáciles de analizar. Ese paso permite separar la información esencial de cada ocupación y preparar el terreno para extraer campos estructurados.

La siguiente etapa consiste en tabular variables clave. Un archivo CSV concentra datos como salario, educación requerida, número de empleos, perspectiva de crecimiento y código SOC. Es decir, el repositorio no solo captura descripciones narrativas de los trabajos, sino también indicadores concretos que ayudan a comparar ocupaciones entre sí.

Más adelante, esos datos se combinan con la evaluación de exposición a la IA y se integran en un archivo compacto para alimentar el sitio web estático. De esta forma, la visualización final no depende de consultas externas en tiempo real, sino de una estructura de datos ya consolidada y lista para el frontend.

Qué mide la puntuación de exposición a la IA

El elemento más llamativo del proyecto es su sistema de puntuación. Cada ocupación recibe una nota entre 0 y 10 bajo un único eje llamado “Exposición al IA”. Esa calificación intenta medir cuánto remodelará la IA una ocupación específica, considerando dos factores: la automatización directa del trabajo y los efectos indirectos de productividad.

En términos simples, una ocupación puede quedar expuesta no solo porque una máquina haga parte de sus tareas, sino también porque una persona asistida por IA pueda hacer el trabajo de varias. Esa diferencia es importante para entender por qué ciertos empleos de oficina y producción digital aparecen en zonas de mayor riesgo, incluso si no desaparecen por completo.

El criterio central del modelo se apoya en una idea sencilla. Si el producto del trabajo es fundamentalmente digital y puede realizarse por completo desde una oficina en casa, frente a una computadora, la exposición a la IA tiende a ser alta. En cambio, los oficios que exigen presencia física, habilidad manual o interacción humana en tiempo real tienen una barrera natural mayor.

Esa lógica ayuda a contextualizar la clasificación. No sugiere necesariamente reemplazo inmediato ni desempleo automático. Más bien apunta a qué ocupaciones podrían experimentar una reconfiguración más profunda, ya sea por automatización de tareas, por nuevas herramientas o por una reorganización de la demanda laboral.

Los trabajos más y menos expuestos, según la escala

El repositorio ofrece ejemplos de calibración que permiten leer mejor la escala. En el rango de 0 a 1, considerado de exposición mínima, aparecen techadores, conserjes y trabajadores de construcción. Son funciones donde el entorno físico, la destreza manual y la variabilidad del trabajo diario dificultan una sustitución amplia por sistemas de IA.

En los niveles de 2 a 3, catalogados como bajos, figuran electricistas, fontaneros, auxiliares de enfermería y bomberos. Aunque parte de sus tareas puede beneficiarse de software o automatización, siguen dependiendo de ejecución física, respuesta en terreno y presencia directa frente a otras personas.

La zona media, de 4 a 5, incluye enfermeras registradas, trabajadores minoristas y médicos. Aquí el proyecto sugiere que la IA podría asistir, ordenar, filtrar y mejorar decisiones, pero sin eliminar la necesidad de supervisión humana, trato interpersonal o intervención profesional en tiempo real.

Más arriba, entre 6 y 7, aparecen profesores, gerentes, contadores e ingenieros. Y en el rango de 8 a 9, clasificado como muy alto, se ubican desarrolladores de software, paralegales, analistas de datos y editores. El máximo de 10 queda reservado en el ejemplo para transcriptores médicos.

El promedio general para las 342 ocupaciones analizadas es de 5,3 sobre 10. Esa cifra sugiere una exposición intermedia a nivel agregado, pero también una dispersión importante entre oficios manuales, profesiones de cuidado y tareas centradas en contenidos o flujos de información digital.

Una visualización pensada para comparar empleo y riesgo

La interfaz principal del proyecto es un treemap interactivo. En esta clase de visualización, cada ocupación se representa como un rectángulo cuyo tamaño es proporcional al número de personas empleadas en esa actividad. Así, el lector puede ver al mismo tiempo qué trabajos son grandes en términos de fuerza laboral y qué tan expuestos estarían a la IA.

El color añade una segunda capa de lectura. El esquema va de verde a rojo, donde verde implica menor exposición y rojo mayor exposición. Además, el diseño agrupa ocupaciones por categorías del BLS, lo que permite observar si ciertos sectores completos tienden a concentrarse en una zona más vulnerable o más resistente.

Al pasar el cursor, el sistema despliega un cuadro con información adicional. Allí se incluyen pago, empleo, perspectiva, educación requerida, puntuación de exposición y el razonamiento generado por el modelo de lenguaje. Esa combinación convierte la visualización en una herramienta exploratoria, no solo en una pieza estética.

Para analistas de tecnología, educación o inversión, el formato es útil porque cruza varios planos a la vez. Muestra tamaño del mercado laboral, presión potencial de la IA y perfil estructural de cada ocupación. Ese cruce puede resultar valioso en debates sobre capacitación, productividad y reasignación de capital humano.

El papel del modelo de lenguaje en la evaluación

La puntuación no fue asignada manualmente ocupación por ocupación. El archivo de calificación envía la descripción en Markdown de cada empleo a un modelo de lenguaje, específicamente Gemini Flash a través de OpenRouter, junto con un criterio de evaluación. De ahí surge una nota de 0 a 10 y una justificación escrita para cada caso.

Ese punto merece atención porque combina datos públicos estructurados con interpretación automatizada. El método permite escalar el análisis a cientos de ocupaciones, aunque también plantea la necesidad de leer los resultados como estimaciones y no como una verdad definitiva sobre el futuro del empleo.

La utilidad del proyecto está precisamente en esa mezcla. No es un informe oficial del BLS ni una proyección gubernamental. Es una capa analítica creada a partir de una fuente sólida y enriquecida con IA generativa. Eso abre espacio para comparaciones, revisión crítica y nuevas iteraciones con otros modelos o criterios.

En un momento en que la discusión pública sobre IA suele oscilar entre entusiasmo y alarma, trabajos como este aportan una base más tangible. Permiten bajar el debate desde afirmaciones generales hacia ocupaciones concretas, con variables visibles y una lógica metodológica que puede ser auditada por cualquier persona desde el propio repositorio.

También es relevante que el proyecto deje a disposición archivos clave como occupations.json, occupations.csv, scores.json, las páginas HTML crudas y las versiones en Markdown. Esa apertura facilita que investigadores, periodistas o desarrolladores reutilicen el material, reproduzcan resultados o propongan nuevos enfoques sobre los mismos datos.

En síntesis, el repositorio de Josh Kale ofrece una radiografía accesible sobre cómo la IA podría remodelar el empleo en Estados Unidos. Su principal aporte no es sentenciar qué trabajos desaparecerán, sino mostrar con claridad qué ocupaciones parecen más expuestas cuando el trabajo es digital, replicable y susceptible de escalar con asistencia algorítmica.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín