Por Angel Di Matteo   𝕏 @shadowargel

Google presentó una nueva versión de Gemini Deep Research basada en su modelo Gemini 3 Pro, ampliando el alcance de los agentes de investigación más allá de los informes tradicionales.

***

  • El nuevo agente puede integrarse en aplicaciones de terceros mediante la Interactions API.
  • Google afirma que Gemini 3 Pro es su modelo más factual y diseñado para reducir alucinaciones.
  • La compañía lanzó un nuevo benchmark de código abierto y comparó resultados con modelos rivales.

 

Google anunció el jueves una versión “reimaginada” de su agente de investigación Gemini Deep Research, ahora impulsado por su modelo fundacional más avanzado, Gemini 3 Pro.

De acuerdo con un reporte publicado por TechCrunch, la compañía tecnológica busca posicionarse con fuerza en la carrera por los agentes de inteligencia artificial capaces de realizar tareas complejas y prolongadas, en un contexto donde la investigación ya no depende únicamente de búsquedas tradicionales.

A diferencia de versiones anteriores, Gemini Deep Research ya no se limita a generar informes extensos. El agente fue diseñado para permitir a desarrolladores integrar directamente las capacidades de investigación de Google en sus propias aplicaciones. Esta expansión funcional marca un cambio estratégico, al trasladar el poder de síntesis y análisis profundo hacia ecosistemas externos al propio Google.

Según la empresa, esta nueva etapa es posible gracias a la Interactions API, una interfaz pensada para ofrecer mayor control a los desarrolladores en lo que Google describe como la inminente era de la IA agentica. El objetivo es que los agentes no solo respondan preguntas, sino que interactúen de forma autónoma con sistemas, flujos de trabajo y aplicaciones complejas.

Un agente preparado para manejar grandes volúmenes de información

Gemini Deep Research fue concebido como un agente capaz de sintetizar enormes cantidades de información y de trabajar con prompts que contienen grandes volúmenes de contexto. Google explicó que esta herramienta ya está siendo utilizada por clientes en tareas que van desde procesos de due diligence hasta investigaciones relacionadas con la seguridad y toxicidad de fármacos.

Estas aplicaciones requieren un alto nivel de precisión, ya que cualquier error puede tener consecuencias significativas. En ese sentido, Google destacó que Gemini 3 Pro es su modelo “más factual” hasta la fecha y que fue entrenado específicamente para minimizar las alucinaciones durante tareas complejas y de razonamiento profundo.

Las alucinaciones en modelos de lenguaje, donde el sistema inventa información, representan un desafío crítico en los agentes que operan durante largos periodos. En tareas que implican múltiples decisiones autónomas, una sola inferencia incorrecta puede invalidar todo el resultado final, según explicó la propia compañía.

Integración con servicios clave de Google

Google también adelantó que planea integrar este nuevo agente de investigación profunda en varios de sus servicios más relevantes. Entre ellos se encuentran Google Search, Google Finance, la aplicación Gemini y NotebookLM, una de sus herramientas más populares para análisis y toma de notas asistida por IA.

Esta estrategia apunta a un futuro en el que los usuarios ya no interactúan directamente con buscadores tradicionales. En su lugar, los agentes de IA se encargarían de consultar, analizar y sintetizar información en nombre de las personas, reduciendo la fricción y el tiempo dedicado a la investigación manual.

El movimiento refuerza la visión de Google sobre un ecosistema donde la búsqueda de información es delegada a sistemas autónomos. Para la empresa, preparar sus productos para ese escenario es una prioridad frente al avance acelerado de competidores en el sector de la inteligencia artificial.

Nuevos benchmarks y comparaciones con la competencia

Para respaldar sus afirmaciones sobre el progreso de Gemini Deep Research, Google presentó un nuevo benchmark llamado DeepSearchQA. Esta prueba está diseñada para evaluar agentes de IA en tareas complejas de búsqueda de información que requieren múltiples pasos y razonamiento encadenado. La compañía decidió liberar este benchmark como código abierto.

Además, Google sometió su agente a otras pruebas externas, como Humanity’s Last Exam, un benchmark independiente de conocimiento general conocido por incluir tareas extremadamente específicas. También se utilizó BrowserComp, una prueba enfocada en tareas agenticas realizadas a través de navegadores web.

De acuerdo con los resultados publicados por Google, su nuevo agente superó a la competencia tanto en su propio benchmark como en Humanity’s Last Exam. Sin embargo, la empresa reconoció que OpenAI ChatGPT 5 Pro obtuvo resultados muy cercanos y logró un desempeño ligeramente superior en BrowserComp.

Un anuncio marcado por la competencia directa

Las comparaciones de benchmarks quedaron rápidamente desactualizadas. El mismo día del anuncio de Google, OpenAI lanzó GPT 5.2, conocido internamente con el nombre en clave Garlic. Según la empresa, este nuevo modelo supera a sus rivales, especialmente a Google, en una serie de benchmarks tradicionales, incluyendo pruebas desarrolladas por la propia OpenAI.

El momento elegido para el anuncio no pasó desapercibido en la industria. Google presentó sus novedades en un contexto donde el mercado esperaba con atención el lanzamiento de Garlic. Para analistas del sector, la coincidencia refleja la intensidad de la competencia entre los principales desarrolladores de modelos de lenguaje avanzados.

Más allá de los resultados comparativos, el anuncio subraya una tendencia clara: la carrera ya no se centra únicamente en modelos más grandes o rápidos, sino en agentes capaces de razonar durante largos periodos, interactuar con sistemas externos y mantener altos niveles de precisión en tareas críticas.


Artículo escrito con ayuda de un redactor de contenido de IA, editado por Angel Di Matteo / DiarioBitcoin

Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín