Por Canuto  

Google comenzó a desplegar Gemini 3, su nueva generación de modelos de inteligencia artificial, con Gemini 3 Pro al frente. La compañía lo presenta como su sistema de IA más inteligente, preciso y menos adulador hasta la fecha, integrado desde el primer día en la app Gemini y en la búsqueda de Google. Con capacidades multimodales, nuevas interfaces generativas y agentes capaces de ejecutar tareas complejas, el movimiento busca reposicionar a Google en la guerra de modelos de IA de consumo frente a OpenAI y el accidentado lanzamiento de GPT-5.
***

  • Google lanza Gemini 3 Pro como su modelo de IA “más inteligente” y “más preciso” disponible para todos en la app Gemini.
  • Gemini 3 Pro es nativamente multimodal, impulsa nuevas interfaces visuales en Search y en la app, y habilita simulaciones interactivas.
  • La compañía promete menos adulación, mejor razonamiento y un agente Gemini capaz de ejecutar tareas complejas en nombre del usuario.

Google está dando un nuevo paso en la competencia global por el liderazgo en inteligencia artificial con el lanzamiento de Gemini 3, una nueva familia de modelos que la empresa presenta como sus sistemas de IA “más inteligentes” y “factualmente precisos” hasta ahora. En el centro de este anuncio está Gemini 3 Pro, el modelo insignia que llega desde el primer día a la app Gemini y a la experiencia de búsqueda de Google.

El movimiento llega en un contexto de fuerte rivalidad con OpenAI y su GPT-5, cuyo lanzamiento fue calificado como accidentado por diversos observadores del sector. Con Gemini 3 Pro, Google busca reposicionarse como referente en modelos de IA orientados al consumidor, apoyándose en mejoras de razonamiento, nuevas capacidades multimodales y una interacción menos cargada de adulación vacía.

La información fue dada a conocer por el medio tecnológico The Verge, que recoge declaraciones de ejecutivos de Google DeepMind y detalles sobre la integración del modelo en productos clave como Search y la app Gemini. La apuesta apunta a transformar la forma en que los usuarios acceden, organizan y consumen información mediante IA.

Tulsee Doshi, directora senior de Google DeepMind y jefa de producto, explicó que la meta es avanzar hacia un motor de búsqueda que entregue una visión más rica y completa, alejándose del paradigma tradicional de respuestas puramente en texto. Esto se traduce en una experiencia más visual, interactiva y contextual para el usuario final.

Gemini 3 Pro: modelo insignia y acceso masivo desde el primer día

Por primera vez, Google está ofreciendo su modelo insignia de IA al gran público desde el día uno. Gemini 3 Pro ya está disponible para todos los usuarios de la app Gemini, sin que la compañía limite su uso inicial a desarrolladores o clientes corporativos. Además, también se incorpora para suscriptores dentro de la experiencia de búsqueda impulsada por IA.

Según lo reportado por The Verge, esta estrategia contrasta con lanzamientos anteriores donde los modelos más avanzados permanecían tras una capa de acceso restringido. En esta ocasión, Google apuesta por un despliegue amplio, lo que refuerza su intento de consolidar una base de usuarios masiva en el segmento de IA de consumo.

Doshi señaló que Gemini 3 Pro acercará a la empresa a su objetivo de hacer la información “accesible y útil para todos”, frase que retoma la misión histórica de Google, pero ahora aplicada al nuevo entorno de motores de búsqueda aumentados con inteligencia artificial. La idea es que la IA no solo responda, sino que también estructure y enriquezca el contexto de lo que el usuario consulta.

La disponibilidad inicial incluye la app Gemini y la integración con Search para suscriptores, lo que sienta las bases para expansiones posteriores a otras regiones y productos del ecosistema Google. Aunque The Verge no detalla calendarios globales, el lanzamiento marca un primer hito en mercados clave como Estados Unidos.

Multimodalidad nativa: texto, imágenes y audio en un solo modelo

Una de las principales características técnicas de Gemini 3 Pro es su naturaleza “nativamente multimodal”. Esto significa que el modelo puede procesar simultáneamente texto, imágenes y audio dentro de un mismo flujo de trabajo, en lugar de tratar cada tipo de dato por separado o encadenar modelos distintos para cada modalidad.

Google ejemplifica estas capacidades con casos de uso cotidianos. El usuario podría tomar fotos de recetas culinarias escritas a mano o impresas, y Gemini 3 Pro sería capaz de traducirlas y convertirlas en un libro de cocina estructurado. Este proceso integraría reconocimiento de imágenes, comprensión de texto y generación de contenido cohesivo.

Otro ejemplo mencionado es la creación de tarjetas didácticas interactivas a partir de una serie de conferencias en video. Allí, el modelo procesaría audio, contenido visual y lenguaje natural para generar materiales de estudio personalizados, lo que puede resultar atractivo para estudiantes universitarios y profesionales que buscan herramientas de aprendizaje más dinámicas.

La multimodalidad abre también la puerta a usos más avanzados en entornos creativos y educativos, donde la integración entre distintos tipos de contenido es clave. Aunque la nota de The Verge no profundiza en métricas específicas de rendimiento, recalca que Google considera estas capacidades como un salto significativo frente a versiones anteriores de Gemini.

Interfaces generativas y Canvas: nuevas formas visuales de interactuar con la IA

Gemini 3 Pro no solo representa un avance en el modelo subyacente, sino también en la forma en que los usuarios interactúan con la IA dentro del ecosistema de Google. La compañía está integrando el modelo en la app Gemini para habilitar funciones de creación más completas dentro del espacio de trabajo llamado Canvas.

En este entorno, las personas podrán desarrollar programas, documentos o proyectos complejos aprovechando la ayuda de la IA de manera integrada. El modelo servirá como asistente creativo y técnico, capaz de combinar texto, imágenes y estructura visual en un mismo flujo de trabajo, lo que puede beneficiar tanto a desarrolladores como a creadores de contenido.

Además, Google está probando una herramienta llamada “interfaces generativas” en Gemini Labs. Esta función se apoya en Gemini 3 Pro para crear formatos visuales más ricos, por ejemplo un diseño al estilo revista con imágenes que se pueden hojear, o una interfaz de usuario dinámica y personalizada según la indicación que reciba el modelo.

La app Gemini también introduce una vista dinámica experimental que genera una experiencia similar a la de una página web para ciertas consultas. En lugar de responder con texto lineal, la IA organiza el contenido en bloques visuales y navegables, acercando la interacción a una navegación web guiada por IA en tiempo real.

Gemini 3 Pro en Modo IA: resultados visuales, simulaciones y mejor búsqueda

Dentro de Search, Gemini 3 Pro potencia el llamado Modo IA, la experiencia de búsqueda que utiliza inteligencia artificial para elaborar respuestas. Según el anuncio recogido por The Verge, el modelo ahora presentará elementos visuales como imágenes, tablas, rejillas y simulaciones embebidas directamente en las respuestas.

Estas simulaciones pueden ser interactivas, lo que permite al usuario experimentar con escenarios o datos sin salir de la interfaz de búsqueda. Esta característica refuerza la visión de Google de convertir su buscador en una plataforma donde la información no solo se consulta, sino que se explora y manipula de manera activa.

La compañía también ha mejorado la llamada “técnica de expansión de consultas”, que ya utilizaba en productos anteriores. En lugar de limitarse a descomponer las preguntas en fragmentos para buscar en nombre del usuario, la nueva versión de la técnica busca comprender mejor la intención y encontrar contenido relevante que el usuario podría haber pasado por alto.

De acuerdo con la información destacada por The Verge, esto debería traducirse en respuestas más útiles, con una cobertura más amplia y profunda de temas complejos, sin requerir que el usuario formule múltiples consultas manuales. La IA se encarga de explorar variaciones y matices de la pregunta para ofrecer una visión más completa.

Menos adulación y respuestas más directas en la guerra contra ChatGPT

Uno de los puntos más llamativos del anuncio es la postura de Google frente al tono de las respuestas de su modelo. La compañía describe a Gemini 3 Pro como menos propenso a la “adulación vacía” que atribuye a algunos comportamientos de ChatGPT, el conocido asistente de OpenAI. Este matiz supone una crítica sutil a su principal rival en el mercado.

Tulsee Doshi afirmó que los usuarios notarán cambios “notables” en las respuestas de Gemini 3 Pro. Según lo reportado, Google busca ofrecer respuestas inteligentes, concisas y directas, reemplazando clichés y halagos innecesarios por una “visión genuina” que diga al usuario lo que necesita oír, no solo lo que quiere oír.

La empresa también afirma haber logrado una “reducción de la adulación”, un tema que OpenAI tuvo que abordar a comienzos de este año con ChatGPT tras críticas sobre un estilo excesivamente complaciente. El enfoque de Google apunta a diferenciar su asistente como una herramienta más pragmática y enfocada en la utilidad.

Para usuarios familiarizados con modelos de lenguaje, este ajuste de tono puede impactar la percepción de confianza y profesionalismo en las respuestas. Menos adornos y más claridad podría ser atractivo para perfiles técnicos, inversores y analistas que buscan precisión sobre cordialidad en las interacciones con IA.

Razonamiento avanzado, planificación y el nuevo Gemini Agent

Además del tono, Google resalta mejoras significativas en razonamiento y capacidad de actuación. De acuerdo con el reporte de The Verge, Gemini 3 Pro ahora puede completar tareas más complejas y planificar de manera fiable a lo largo de horizontes de tiempo más largos. Esto se traduce en una mejor habilidad para dividir problemas, ordenar pasos y ejecutar procesos encadenados.

Estas capacidades sirven como base para una función experimental llamada Gemini Agent, que opera dentro de la app Gemini. Este agente puede realizar tareas en nombre del usuario, como revisar y organizar correos electrónicos, o investigar y reservar viajes, lo que lo acerca al concepto de un asistente autónomo que actúa más allá de simples respuestas de texto.

Para quienes siguen la evolución de agentes inteligentes en el ecosistema de IA, Gemini Agent representa un paso clave hacia herramientas que gestionan flujos de trabajo completos. No se trata solo de contestar preguntas, sino de ejecutar acciones concretas, integradas con servicios y datos personales del usuario, siempre bajo permisos adecuados.

En esta fase, Gemini Agent está disponible para suscriptores de Google AI Pro y Ultra en Estados Unidos a través de la app Gemini. Estos usuarios podrán experimentar tanto con el agente como con Gemini 3 Pro en el Modo IA, seleccionando la opción “Thinking” en el menú desplegable del modelo.

Rendimiento en benchmarks y acceso a funciones avanzadas

El rendimiento de Gemini 3 Pro en pruebas externas también fue subrayado en la cobertura de The Verge. El modelo encabeza actualmente la tabla de clasificación de LMArena, una plataforma popular utilizada para evaluar modelos de IA y comparar su desempeño en diferentes tareas de lenguaje y razonamiento.

Google incluyó además un modo llamado Deep Think, diseñado para mejorar de forma adicional las capacidades de razonamiento del modelo. Aunque la compañía no detalla públicamente los aspectos técnicos de este modo, se indica que está orientado a escenarios donde se requiere análisis más profundo y cuidadoso.

Por el momento, Deep Think solo está disponible para evaluadores de seguridad, lo que sugiere que Google está probando su comportamiento y riesgos potenciales antes de abrirlo a un público más amplio. Este enfoque es consistente con la tendencia de compañías de IA que priorizan pruebas de seguridad en funciones más potentes.

Mientras tanto, el acceso general a Gemini 3 Pro en la app Gemini ya está habilitado para todos los usuarios, lo que garantiza una base de prueba extensa en uso real. Para las funciones avanzadas de agentes y Modo IA con configuración específica, el acceso se limita a suscriptores de pago en el mercado estadounidense, según detalla el informe.

Disponibilidad, suscripciones y contexto competitivo en IA

Desde hoy, cualquier usuario puede acceder a Gemini 3 Pro dentro de la app Gemini, de acuerdo con la información recopilada por The Verge. Esto posiciona a la aplicación como la puerta principal hacia el modelo más avanzado de Google, que se integrará progresivamente con más funciones y servicios internos.

En paralelo, los suscriptores de Google AI Pro y Ultra en Estados Unidos tienen la posibilidad de probar Gemini Agent, así como utilizar Gemini 3 Pro en el Modo IA de Search seleccionando la opción “Thinking” en el menú del modelo. Estos niveles de suscripción otorgan acceso prioritario a las características más experimentales y de mayor capacidad.

El anuncio se inscribe en una carrera por dominar el mercado de IA generativa orientada al consumidor, en la que participan actores como OpenAI, Microsoft y otros proveedores. El lanzamiento accidentado de GPT-5 ofrece a Google una ventana de oportunidad para reposicionarse como líder, especialmente si logra combinar precisión, usabilidad y despliegue masivo.

Para usuarios interesados en criptomonedas, mercados y tecnología financiera, el auge de modelos como Gemini 3 Pro puede tener impacto indirecto en herramientas de análisis, bots de trading, agregadores de noticias y filtros de investigación automatizada. Aunque el artículo de The Verge no entra en estas aplicaciones, el salto en razonamiento y agente autónomo sugiere un potencial importante para el ecosistema fintech e IA.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín