Anthropic presentó Claude Opus 4.8, una actualización de su modelo insignia que mejora en programación, razonamiento, tareas agénticas y trabajo de conocimiento, mientras mantiene el mismo precio de uso regular. La empresa también añadió nuevas funciones en Claude Code, controles de esfuerzo para usuarios y cambios en la API que apuntan a flujos de trabajo más largos, complejos y autónomos.
***
- Anthropic lanzó Claude Opus 4.8 con mejoras frente a Opus 4.7 en precisión, razonamiento y uso de herramientas.
- La empresa añadió flujos de trabajo dinámicos en Claude Code, control de esfuerzo en claude.ai y cambios en la API de Messages.
- El modelo mantiene el precio de Opus 4.7 y suma un modo rápido que trabaja hasta 2,5 veces más veloz.
Anthropic anunció el lanzamiento de Claude Opus 4.8, una nueva versión de su modelo de IA de gama alta orientado a programación, razonamiento y tareas agénticas. La actualización ya está disponible y, según la empresa, se apoya en la base de Opus 4.7 con mejoras en distintos benchmarks y en la calidad de la colaboración con usuarios y desarrolladores.
El movimiento llega en un momento en el que los laboratorios de inteligencia artificial compiten no solo por obtener mejores resultados en pruebas técnicas, sino también por demostrar utilidad real en flujos de trabajo empresariales. En ese contexto, Anthropic busca posicionar a Opus 4.8 como un sistema más confiable para tareas extensas, complejas y de alto impacto.
Además del nuevo modelo, la compañía activó varias funciones complementarias. Entre ellas figuran un control para decidir cuánto esfuerzo dedica Claude a una tarea, una nueva capacidad de “flujos de trabajo dinámicos” en Claude Code y una actualización en la API de Messages para permitir instrucciones de sistema dentro del arreglo de mensajes.
La actualización mantiene el precio de uso regular respecto a Opus 4.7. Anthropic fijó el costo en USD $5 por millón de tokens de entrada y USD $25 por millón de tokens de salida. Para el modo rápido, el precio quedó en USD $10 por millón de tokens de entrada y USD $50 por millón de tokens de salida.
Qué cambia con Claude Opus 4.8
En su presentación oficial, Anthropic describió a Opus 4.8 como una mejora “modesta pero tangible” frente a su predecesor. La empresa sostuvo que el modelo eleva su desempeño en pruebas de programación, habilidades agénticas, razonamiento y trabajo práctico con conocimiento, aunque remitió los detalles completos a la System Card del sistema.
Uno de los ejes de la presentación fue la colaboración con el usuario. Los primeros evaluadores citados por la compañía afirmaron que el modelo muestra mejor criterio al hacer preguntas, detectar sus propios errores y oponerse cuando un plan no parece sólido. También reportaron más consistencia para mantener contexto y estilo durante sesiones largas.
En el terreno del desarrollo de software, evaluadores indicaron que Opus 4.8 supera a modelos Opus anteriores en todos los niveles de esfuerzo dentro de CursorBench. Según esos testimonios, el uso de herramientas es más eficiente y el modelo requiere menos pasos para completar tareas equivalentes de principio a fin.
La empresa también reunió comentarios de actores enfocados en automatización, uso de navegador, derecho, análisis financiero y sistemas empresariales. En esas pruebas, Opus 4.8 fue descrito como más rápido, más preciso en citas, más eficiente en consumo de tokens y mejor preparado para operaciones autónomas sin supervisión constante.
Entre los datos destacados, Anthropic afirmó que en Online-Mind2Web el modelo alcanzó una puntuación de 84 %, lo que representaría un salto frente a Opus 4.7 y GPT-5.5. También señaló que, en un benchmark legal con estándar de “all-pass”, fue el primer modelo en superar el 10 % global.
Más honestidad y menos afirmaciones sin respaldo
Anthropic puso especial énfasis en la “honestidad” de Opus 4.8. La empresa explicó que uno de los problemas recurrentes en los modelos de IA es la tendencia a sacar conclusiones apresuradas o a afirmar con seguridad que avanzaron en su trabajo cuando la evidencia todavía es insuficiente.
De acuerdo con la compañía, los primeros evaluadores detectaron que Opus 4.8 tiene más probabilidad de señalar incertidumbres y menos tendencia a hacer afirmaciones sin respaldo. En sus evaluaciones internas, Anthropic indicó que el nuevo modelo tiene cerca de cuatro veces menos probabilidad que su predecesor de dejar pasar defectos en código que él mismo escribió sin comentarlos.
La firma añadió que su equipo de Alignment concluyó que Opus 4.8 alcanza nuevos máximos en mediciones de rasgos prosociales, entre ellos apoyar la autonomía del usuario y actuar en su mejor interés. Según esa evaluación, el modelo también mostró tasas de comportamiento desalineado sustancialmente más bajas que Opus 4.7.
Anthropic precisó que esas tasas resultan similares a las observadas en Claude Mythos Preview, al que describió como su modelo mejor alineado. La evaluación completa de alineación y las pruebas de seguridad previas al despliegue, agregó la empresa, se incluyen en la Claude Opus 4.8 System Card.
Nuevas funciones para Claude Code, claude.ai y la API
Junto con el lanzamiento del modelo, Anthropic habilitó “flujos de trabajo dinámicos” en vista previa de investigación para Claude Code. Esta función permite al sistema planificar trabajo y ejecutar cientos de subagentes en paralelo dentro de una sola sesión, para luego verificar resultados antes de entregar una respuesta al usuario.
La empresa sostuvo que, con Opus 4.8, esos agentes pueden operar durante más tiempo. Como ejemplo, indicó que Claude Code ahora puede realizar migraciones a escala de base de código sobre cientos de miles de líneas, desde el inicio hasta el merge, usando la suite de pruebas existente como criterio de validación.
Estos flujos de trabajo dinámicos están disponibles en Claude Code para planes Enterprise, Team y Max. El anuncio apunta a un mercado donde la IA deja de ser solo un chatbot y empieza a asumir tareas de orquestación técnica que antes exigían varios desarrolladores, supervisión constante y herramientas separadas.
Anthropic también presentó un control de esfuerzo en claude.ai y Cowork. Este ajuste aparece junto al selector de modelo y permite al usuario decidir cuánto esfuerzo dedicará Claude a una respuesta. En niveles más altos, el sistema piensa con mayor profundidad y frecuencia. En niveles más bajos, responde más rápido y consume más lentamente los límites de uso.
La compañía añadió, además, que la API de Messages ahora acepta entradas de sistema dentro del array de mensajes. Esto permite a los desarrolladores cambiar instrucciones a mitad de una tarea sin romper la caché del prompt ni forzar esa actualización mediante un turno de usuario, algo útil para ajustar permisos, presupuestos de tokens o contexto del entorno mientras un agente está en marcha.
Esfuerzo por defecto, costos y disponibilidad global
Anthropic explicó que Opus 4.8 usa por defecto un esfuerzo alto, definido por la empresa como el mejor equilibrio general entre calidad y experiencia de uso. En tareas de programación, ese nivel consume una cantidad de tokens similar al ajuste por defecto de Opus 4.7, pero con mejor rendimiento.
Los usuarios pueden seleccionar también “extra”, identificado como “xhigh” en Claude Code, o “max”. Ambas opciones elevan el uso de tokens a cambio de mejores resultados. La empresa recomendó “extra” para tareas difíciles y flujos de trabajo asincrónicos de larga duración.
Para acomodar ese mayor consumo, Anthropic señaló que elevó los límites de uso en Claude Code. La idea es que cada usuario pueda escoger el nivel de esfuerzo que tenga sentido según el proyecto, el presupuesto y el tiempo disponible para ejecutar una tarea determinada.
En cuanto a disponibilidad, Claude Opus 4.8 ya puede usarse “en todas partes” desde hoy. Los desarrolladores pueden acceder al modelo mediante la Claude API con el identificador claude-opus-4-8, lo que facilita su integración en productos propios, asistentes corporativos o sistemas automatizados de desarrollo y análisis.
La hoja de ruta: modelos más baratos y la clase Mythos
Más allá del anuncio inmediato, Anthropic adelantó parte de su siguiente fase. La empresa afirmó que trabaja en modelos capaces de ofrecer muchas de las capacidades de Opus a un costo más bajo, un punto clave en un mercado que empieza a medir con más atención la relación entre rendimiento y precio.
La compañía también dijo que planea lanzar una nueva clase de modelo con inteligencia superior a Opus. Ese desarrollo se relaciona con Project Glasswing, programa bajo el cual un pequeño grupo de organizaciones ya utiliza Claude Mythos Preview para trabajo de ciberseguridad.
Anthropic advirtió que los modelos de ese nivel requieren salvaguardas cibernéticas más sólidas antes de una liberación general. Según su explicación, la empresa está avanzando rápidamente en esas protecciones y espera poder poner los modelos de clase Mythos a disposición de todos sus clientes en las próximas semanas.
Ese último punto sugiere que la carrera por modelos más potentes está entrando en una nueva etapa. Ya no se trata solo de mejorar benchmarks o reducir alucinaciones, sino también de construir sistemas que puedan operar con más autonomía sin elevar de forma inaceptable los riesgos de seguridad, abuso o comportamiento desalineado.
Para el mercado de IA empresarial, el anuncio de Opus 4.8 funciona así en dos niveles. Por un lado, ofrece una actualización inmediata con mejoras prácticas en velocidad, confiabilidad y uso de herramientas. Por otro, prepara el terreno para una familia de modelos más avanzada, que Anthropic todavía mantiene bajo restricciones adicionales antes de su apertura general.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público
Este artículo fue escrito por un redactor de contenido de IA
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
IA
YouTube refuerza su apuesta por podcasts con IA, velocidad automática y modo para llevar
Ethereum
Vitalik Buterin: código abierto es la única vía para que Europa compita con EE. UU. y China
Criptomonedas
Gemini presenta nueva herramienta IA junto a SpaceXAI para mercados de predicción
Bancos y Pagos