Dos exejecutivos de Goldman Sachs y Meta han fundado AethexAI, una startup que recaudó USD $3 millones para desarrollar modelos de IA de voz optimizados para los dialectos y la infraestructura de África y Oriente Medio.
***
- AethexAI recaudó USD $3.000.000 en financiación pre-semilla liderada por 4DX Ventures para desarrollar IA de voz en mercados emergentes.
- La startup construyó su propia serie de modelos Kora, con parámetros reducidos para minimizar la latencia y soportar dialectos locales.
- El sistema procesa más de 17.000 llamadas diarias, enfocándose en casos de uso como cobro de deudas, activación de clientes y verificación KYC.
La inteligencia artificial (IA) generativa está transformando rápidamente el servicio al cliente a nivel global. Sin embargo, las soluciones diseñadas en Silicon Valley a menudo fracasan al enfrentarse a las realidades técnicas y lingüísticas de los mercados emergentes.
Mariama Diallo y Ayooluwa Odemuyiwa dejaron sus posiciones en Goldman Sachs y Meta para fundar AethexAI. Esta startup nació el año pasado con el objetivo de cerrar la brecha tecnológica en regiones desatendidas por los gigantes de la inteligencia artificial.
Recientemente, la empresa aseguró USD $3.000.000 en una ronda de financiación pre-semilla. El inversor principal fue 4DX Ventures, con la participación activa de Enza Capital, Dorm Room Fund, Mojo Ventures y el Stanford GSB 26 Fund.
La ronda también atrajo a inversores individuales de alto perfil. Estos incluyen a profesores de la Universidad de Stanford, ejecutivos del sector de telecomunicaciones e investigadores de inteligencia artificial de la compañía Anthropic.
El mercado de soporte y servicio al cliente experimenta un auge sin precedentes en el sector de la inteligencia artificial de voz. No obstante, crear un producto que suene humano y responda sin retrasos notorios presenta desafíos únicos en ciertas geografías.
Desafíos técnicos y latencia en mercados emergentes
La mayoría de los grandes actores tecnológicos no diseñaron sus herramientas pensando en África y Oriente Medio. Esta omisión estratégica dejó a miles de empresas locales sin soluciones de automatización verdaderamente efectivas.
Para resolver este problema, AethexAI decidió no utilizar herramientas de orquestación existentes en el mercado. Plataformas populares como Vapi y LiveKit simplemente no cumplían con los requisitos técnicos de la región.
La empresa construyó su propio modelo pequeño y su capa de orquestación desde cero. Esta arquitectura personalizada permite manejar los dialectos localizados de inglés, francés y árabe que predominan en sus mercados objetivo.
Ayooluwa Odemuyiwa, quien se graduó en Caltech y trabajó en Meta, explicó la importancia de esta decisión técnica. El director técnico subrayó que la latencia y el jitter en las llamadas automatizadas de la región eran completamente inaceptables.
Un centro de llamadas en Egipto automatizó una parte importante de sus operaciones, pero tuvo que revertir el sistema por los malos resultados. Este tipo de fracasos demostró la necesidad imperante de soluciones adaptadas a la infraestructura local.
Si la startup hubiera actuado solo como integradora, habría dependido de modelos grandes alojados fuera de la región. Esto habría provocado retrasos inmanejables debido a la distancia física de los servidores y la precaria infraestructura de red.
La serie Kora y la recolección de datos alternativos
Los laboratorios de inteligencia artificial tradicionales gastan millones de dólares en entrenar modelos masivos y adquirir bases de datos estandarizadas. AethexAI encontró una solución mucho más eficiente y adaptada a su entorno operativo.
La compañía desarrolló su propia serie de modelos llamada Kora. Estos modelos operan con parámetros que van desde los 300.000.000 hasta los 1.700.000.000, una fracción mínima comparada con los modelos de lenguaje de gran tamaño.
Para entrenar estos algoritmos, la startup utilizó grabaciones anónimas de un centro de llamadas asociado. Además, enviaron discos duros físicos a emisoras de radio en toda África para recopilar datos de audio auténticos y contextualizados.
Con el objetivo de mantener los costos operativos bajo control, crearon una red de colaboradores universitarios. Estos estudiantes anotaron datos y pronunciaron nombres locales, garantizando una precisión cultural que los modelos occidentales no poseen.
Varios centros de soporte en África comentaron a los fundadores que contratar ingenieros locales para automatizar llamadas era un dolor de cabeza persistente. La escasez de talento técnico especializado hacía inviable el desarrollo interno para muchas empresas.
Adopción empresarial y casos de uso reales
Gracias a esta metodología innovadora, la startup gestiona actualmente más de 17.000 llamadas diarias. La plataforma ya está disponible para que las empresas prueben la tecnología y se suscriban a sus servicios comerciales.
Los desarrolladores también pueden acceder a las API y SDK de la compañía. Esto permite a los equipos técnicos locales experimentar directamente con los modelos y adaptarlos a sus propias aplicaciones empresariales.
Mariama Diallo, quien previamente se unió a la empresa ModelML respaldada por Y Combinator, lidera la estrategia comercial. La directora ejecutiva guía a los clientes nuevos en la automatización mediante demostraciones presenciales y talleres especializados.
La empresa aconseja a sus clientes elegir un solo caso de uso crítico para comenzar. Diallo enfatiza que, al ser una empresa pequeña, prefieren garantizar el éxito en un área específica antes de intentar abarcar todos los procesos.
Actualmente, una gran parte de sus implementaciones involucra llamadas para el cobro de deudas. También destacan las campañas de activación de clientes y los procesos de verificación de identidad KYC para bancos y telecomunicaciones.
El volumen de llamadas y la visión de los inversores
Walter Baddoo, cofundador de 4DX Ventures, destacó la naturaleza fundamentalmente distinta de estos mercados. Las empresas en África y Oriente Medio procesan aproximadamente tres veces el volumen de llamadas que sus pares occidentales.
La voz sigue siendo el canal dominante y preferido para la interacción con los clientes en estas regiones. Los sistemas occidentales, diseñados para infraestructuras de alta gama y flujos de trabajo estandarizados, fallan al replicar esta realidad.
Las soluciones extranjeras carecen de la capacidad para manejar la alternancia de códigos lingüísticos y los patrones de habla informal. AethexAI construye su infraestructura sobre la telefonía existente y los puntos de precio reales de la región.
Mientras gigantes globales como ElevenLabs o Deepgram se expanden rápidamente, a menudo ignoran las brechas estructurales de los mercados emergentes. Startups locales apuestan a que la especialización en dialectos representa oportunidades masivas e inaccesibles para los gigantes tecnológicos.
Según informó el medio TechCrunch, la compañía está contratando ingenieros sobre el terreno para servir a los mercados locales. Asimismo, establecen alianzas de canal con proveedores de telecomunicaciones para gestionar la telefonía de las llamadas de IA de voz.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público
Este artículo fue escrito por un redactor de contenido de IA
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Empresas
Instagram alerta: hackers están usando el chatbot de Meta para robar cuentas de usuarios
Empresas
Amazon usaría IA para mostrar productos falsos en búsquedas: ¿engaño o innovación?
AltCoins
TAO se desploma un 11% el 3 de junio de 2026 y alerta por ruptura de soportes
Empresas