Por Canuto  

Amazon ha lanzado Nova Sonic, un modelo de inteligencia artificial generativa para procesamiento de voz que promete mejorar la calidad conversacional y reducir costos en comparación con modelos existentes, como los de OpenAI y Google.
***

  • Nova Sonic es el nuevo modelo de IA de voz de Amazon.
  • Promete reducir costos hasta un 80% en comparación con GPT-4o de OpenAI.
  • Supera modelos existentes en reconocimiento de voz y calidad conversacional.

Amazon ha dado un paso significativo en el área de inteligencia artificial y procesamiento de voz con el lanzamiento de Nova Sonic.

Esta nueva tecnología, presentada por la compañía en un evento reciente, promete ofrecer un rendimiento competitivo frente a rivales como OpenAI y Google, según TechCrunch.

Avances significativos en el procesamiento de voz

Nova Sonic ha sido descrita como una mejora importante en la capacidad de procesamiento de voz nativa.

En el pasado, los asistentes digitales como Alexa de Amazon o Siri de Apple han sido criticados por comportarse de una manera rígida o poco natural. Con innovaciones tecnológicas como Sonic, Amazon busca cambiar esta percepción, ofreciendo interacciones más fluidas y naturales para los usuarios.

Una característica destacada de Nova Sonic es su disponibilidad mediante Bedrock, la plataforma de Amazon diseñada para desarrolladores de IA empresarial, que ahora cuenta con una nueva API de transmisión bidireccional. Según el comunicado de prensa emitido por Amazon, este modelo es un 80% más económico que el modelo GPT-4o de OpenAI, lo que lo convierte en una opción atractiva para las empresas que buscan integrar soluciones de IA eficientes en costos.

Funcionalidades destacadas y precisión mejorada

Rohit Prasad, Vicepresidente Senior de Amazon y Jefe Científico de AGI, explicó que Nova Sonic se integra en el amplio ‘sistema de orquestación grande’ de Amazon, que también alimenta a Alexa. Este sistema permite a Nova Sonic enrutar eficientemente las solicitudes de los usuarios y acceder a herramientas específicas cuando sea necesario, mejorando la experiencia del usuario final.

Amazon asegura que Nova Sonic está diseñado para interactuar de manera correcta en diálogos bidireccionales, considerando pausas e interrupciones del hablante. También se caracteriza por generar transcripciones precisas del discurso del usuario, con una tasa de error de palabras (WER) de solo 4.2% en pruebas multilingües.

Impacto en la estrategia de AI de Amazon

La presentación de Nova Sonic forma parte de una estrategia más amplia de Amazon para avanzar hacia la inteligencia general artificial (AGI). Esto incluye desarrollar sistemas de IA que puedan manejar tareas que los humanos realizan con computadoras, ampliando el alcance y la funcionalidad de los actuales asistentes digitales.

La compañía tiene previsto seguir evolucionando su línea de modelos de IA para abarcar otras modalidades como imagen, video, y datos sensoriales, integrándose más en el mundo físico. Esta visión a largo plazo refleja el compromiso de Amazon con la innovación continua en el ámbito de la inteligencia artificial.

Prasad sugirió que con el lanzamiento de modelos como Nova Sonic, Amazon busca proporcionar a los desarrolladores más herramientas internas para construir soluciones altamente eficientes y avanzadas.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín