Por Canuto  

La carrera por construir robots humanoides útiles dentro del hogar está abriendo un mercado inesperado: miles de personas en decenas de países ya se graban cocinando, limpiando y cuidando mascotas para generar los datos que la IA física todavía no puede obtener por sí sola.
***

  • Micro1 asegura que cuenta con unos 4.000 trabajadores en 71 países, que envían más de 160.000 horas de video cada mes.
  • Empresas de robótica y anotación de datos buscan grabaciones en primera persona para enseñar a los robots tareas domésticas y laborales.
  • Expertos advierten que la última milla de la automatización sigue siendo difícil por la imprevisibilidad del hogar y los riesgos de seguridad.


La ambición de llevar robots humanoides a tiendas, oficinas y hogares está creando un nuevo tipo de empleo digital. En lugar de programar máquinas o ensamblar hardware, miles de personas ahora graban su vida cotidiana para producir datos que sirvan de entrenamiento a sistemas robóticos impulsados por inteligencia artificial.

Según reportó CNN en el artículo How filming your chores could train the android butlers of the future, el insumo más buscado en esta etapa son videos en primera persona de tareas comunes como cocinar, limpiar, hacer jardinería y cuidar mascotas. En la industria ya se les conoce como datos egocéntricos o datos humanos.

La lógica detrás de esta tendencia es simple. Si una empresa quiere que un robot manipule objetos, navegue una cocina o recoja cosas del suelo sin causar daños, necesita mostrarle muchísimos ejemplos del mundo real. Internet ofreció texto, imágenes y video para entrenar modelos generativos, pero no existe una biblioteca equivalente y lista para usar sobre interacción física doméstica.

Ese vacío abrió una oportunidad comercial para startups que reclutan trabajadores por contrato, les envían equipos de grabación y luego anotan el material para que los robots puedan distinguir objetos, distancias, trayectorias y movimientos. La meta no es solo que una máquina vea, sino que aprenda a actuar con seguridad en espacios desordenados e impredecibles.

Un nuevo mercado global de videos domésticos

Arian Sadeghi, vicepresidente de datos de robótica en Micro1, explicó que este tipo de información será necesaria en casi cualquier entorno. Mencionó manufactura, almacenes de fábricas, comercio minorista, residencias de ancianos y hospitales, además de los hogares, porque los movimientos cambian según el lugar y el contexto.

Micro1, con sede en Palo Alto, California, comenzó a reclutar su propio ejército de videógrafos remotos el año pasado. Cada trabajador recibe un kit para fijar una cámara, instrucciones de filmación y una lista de tareas. La empresa espera que alternen asignaciones y entreguen al menos 10 horas de video por semana.

Sadeghi dijo que, aunque hoy la mayoría de las grabaciones se concentra en labores del hogar, la compañía también anima a los contratistas a registrar cualquier actividad que, a su juicio, un robot podría hacer en el futuro. Su mensaje a los participantes es directo: si creen que querrían que un robot hiciera algo por ellos, deberían grabarlo.

De acuerdo con el ejecutivo, Micro1 ya cuenta con unos 4.000 “generalistas de robótica” distribuidos en hogares de 71 países. Entre todos envían más de 160.000 horas de video al mes. Aun así, Sadeghi considera que esa cifra está muy lejos de lo necesario y sostuvo que probablemente hagan falta miles de millones de horas.

La escala del reto refleja una diferencia clave entre la IA conversacional y la robótica. ChatGPT y otros chatbots pudieron entrenarse con cientos de miles de millones de palabras extraídas de internet. En cambio, un robot que debe manipular un vaso, doblar ropa o moverse entre muebles requiere datos mucho más específicos y situados.

Ese déficit también está impulsando a empresas de etiquetado de datos. Firmas de investigación de mercado estiman que la industria de recopilación y anotación crecerá cerca de un 30% anual en promedio, liderada por Asia, hasta alcanzar al menos USD $10.000 millones en 2030.

Por qué estos datos son tan valiosos

Ravi Rajalingam, fundador de Objectways, ya había trabajado en el suministro de audio y video para entrenar asistentes virtuales con IA y vehículos autónomos. El año pasado decidió enfocarse en robótica y empezó a contratar personas para recolectar datos humanos.

Desde entonces descubrió un problema operativo importante. Solo cerca de la mitad del material recibido termina siendo utilizable. Eso implica revisar calidad de imagen, consistencia, ángulo, continuidad, diversidad de acciones y capacidad real del video para transformarse en ejemplos útiles para entrenamiento.

Rajalingam explicó además que la ubicación del hogar importa. Con el 90% de sus clientes en Estados Unidos, y bajo la idea de que los consumidores estadounidenses podrían adoptar robots humanoides antes que otros mercados, algunos clientes pagan más por datos tomados en casas estadounidenses. La tarifa por hora puede ser hasta tres veces superior a la de trabajadores en Vietnam o India.

La razón es cultural y práctica al mismo tiempo. Una cocina india no se organiza igual que una cocina estadounidense. Tampoco se usan las mismas escobas, utensilios ni rutinas. Por eso, aunque la variedad global es importante, la selección del material depende de dónde planean desplegar primero sus robots las compañías compradoras.

Esta capa de localización convierte al dato humano en un activo estratégico. No basta con acumular horas. También importa qué objetos aparecen, cómo se manipulan, en qué tipo de viviendas y bajo qué hábitos domésticos. Esa especificidad puede definir si un robot se adapta rápido o fracasa fuera del laboratorio.

Entre control remoto, simulación y video en primera persona

Durante décadas, los robots fueron entrenados sobre todo mediante teleoperación. En ese método, un humano controla la máquina a distancia para enseñarle una tarea. El problema es que requiere hardware costoso y operaciones complejas, lo que eleva las barreras de entrada para startups y laboratorios.

Una opción más barata ha sido la simulación por software. Allí los robots aprenden en mundos virtuales antes de pasar al entorno físico. Sin embargo, este enfoque suele mostrar limitaciones cuando la tarea exige contacto preciso con objetos reales, como levantar un vaso o desenroscar una tapa.

Alicia Veneziani, vicepresidenta de expansión de mercado de Sharpa, una startup de androides en Singapur especializada en manos robóticas, resumió este dilema al afirmar que siempre existe una compensación entre calidad y cantidad cuando se habla de datos.

En China, donde el Estado está impulsando las industrias de alta tecnología, ya se anunciaron planes para al menos 60 centros de entrenamiento de robots. Marco Wang, analista en Shanghái de Interact Analysis, señaló que la mayoría de los robots humanoides producidos en masa en ese país han sido comprados hasta ahora con fines de entrenamiento e investigación.

Wang indicó que a finales del año pasado la industria comenzó a adoptar con mayor fuerza el uso de datos humanos como una solución intermedia. Desde su perspectiva, esta vía reduce costos, porque en lugar de pagar por robots para recopilar demostraciones, las empresas solo necesitan un dispositivo de grabación, como una GoPro, unas gafas Meta o un teléfono inteligente, además de salarios por hora de entre USD $5 y USD $20 según la región.

El analista agregó que ha observado modelos parecidos en Japón y Corea del Sur, con bases operativas en el sudeste asiático para aprovechar mano de obra más barata. También apuntó que Tesla ha estado entrenando a su robot humanoide Optimus en sus instalaciones de Fremont, California, y que planea expandirse en Austin, Texas.

Mientras tanto, Estados Unidos y Europa suelen inclinarse más por el entrenamiento mediante simulación impulsado por Nvidia. Aun así, la propia Nvidia señaló en un informe de febrero que incorporar más de 20.000 horas de videos en primera persona mejoró en más de un 50% la tasa de éxito en tareas como enrollar camisetas, clasificar naipes, desenroscar tapas de botellas y usar una jeringa.

Para Wang, eso sugiere que ninguna técnica bastará por sí sola. En su opinión, el futuro combinará simulación, teleoperación y datos humanos grabados en escenarios reales. Esa mezcla podría volverse el estándar conforme la robótica intente salir de entornos controlados.

La última milla de la automatización todavía está lejos

Puneet Jindal, cofundador de Labellerr AI, considera que el verdadero punto de inflexión llegó hace tres años, cuando los grandes modelos de lenguaje que hicieron posible ChatGPT ayudaron a impulsar algoritmos capaces de traducir señales visuales en acción física. Desde entonces, los robots han empezado a percibir y navegar el entorno con mayor autonomía.

Su empresa comenzó este año a recopilar videos en primera persona de trabajadores en instalaciones manufactureras en India. Jindal cree que, durante los próximos tres años, priorizar los datos humanos será una decisión obvia. Sin embargo, también advirtió que este auge podría no durar demasiado.

Según su visión, ese mismo contenido podría servir pronto para mejorar entrenamientos por simulación, o incluso quedar parcialmente reemplazado si la IA aprende a convertir videos comunes de internet en secuencias útiles en primera persona. En otras palabras, ni siquiera los laboratorios de robótica tienen total claridad sobre qué tipo de datos serán los más valiosos dentro de 12 meses.

Detrás de esa incertidumbre hay un problema técnico profundo. Rutav Shah, investigador en robótica de la Universidad de Texas en Austin, explicó que el gran obstáculo para los robots de propósito general es la extrema imprevisibilidad de los hogares. Los muebles cambian de lugar, los electrodomésticos se mueven y las personas alteran el entorno constantemente.

Shah afirmó que lo que verdaderamente falta es una intuición parecida a la humana sobre fuerzas, fricción e incertidumbre, una capacidad que las personas desarrollan a lo largo de toda la vida. Por eso, lograr que los robots sean realmente útiles para tareas cotidianas como cocinar y limpiar sigue representando la última milla de la automatización.

Alexander Verl, presidente de investigación de la Federación Internacional de Robótica, sostuvo que los robots humanoides se han desplegado principalmente en fábricas y otros entornos controlados, donde pueden completar sus tareas el 99,9% del tiempo. Pero ese rendimiento no se traslada todavía al hogar. Incluso en una tarea aparentemente simple como doblar camisetas, la tasa de éxito actual ronda entre el 70% y el 80%, un nivel que no resulta comercialmente viable para muchos socios industriales.

Rajalingam subrayó además un riesgo de seguridad decisivo. Si un robot limpia una sala de juegos y no puede distinguir entre una muñeca y un bebé humano, las consecuencias podrían ser graves. Lo resumió con crudeza al señalar que si la máquina tomara a un bebé y lo metiera en un contenedor, aparecería una demanda millonaria.

Ese escenario extremo muestra por qué el entusiasmo del mercado todavía convive con cautela. Probar robots con bebés sigue estando muy lejos, dijo Rajalingam. Sin embargo, añadió que ya han empezado con perros. La frase resume el momento actual de la industria: el progreso es real, pero la robótica doméstica aún está aprendiendo, literalmente, observando a los humanos hacer sus tareas de siempre.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín