Microsoft presentó Web IQ, una nueva capa de APIs para conectar agentes de inteligencia artificial con información reciente de la web. La compañía promete mejor evidencia, menor latencia y mayor eficiencia de tokens para una era en la que los modelos ya no pueden depender solo de lo que aprendieron durante su entrenamiento.
***
- Web IQ usa la base global de Bing, pero Microsoft afirma que rediseñó la pila para flujos de trabajo agénticos.
- La compañía reporta una latencia p95 inferior a 165 ms y mejores resultados en su métrica interna GDSAT.
- El sistema devuelve pasajes y objetos de evidencia, no solo documentos, para reducir tokens y costos por llamada.
Microsoft presentó Web IQ, un conjunto de APIs de grounding nativas de inteligencia artificial diseñado para conectar sistemas y agentes de IA con información reciente de la web. La propuesta cubre páginas web, noticias, imágenes y videos, con el objetivo de entregar evidencia útil para razonamiento automatizado.
El anuncio, compartido a través del blog oficial de Bing, llega en un momento clave para la industria. Los modelos de IA pueden responder con fluidez, pero su utilidad cae cuando trabajan con datos desactualizados o incompletos. Ese problema afecta a cualquier sector que dependa de información cambiante, desde mercados financieros hasta criptoactivos, ciberseguridad, comercio electrónico y análisis regulatorio.
Según Microsoft, la capacidad del modelo ya no basta para definir si un sistema de IA resulta útil. La compañía sostiene que el valor depende cada vez más de cómo el sistema conecta esos modelos con el mundo real, incluida la información publicada después del entrenamiento del modelo y aquella demasiado amplia para quedar codificada en sus pesos.
Web IQ se presenta como un motor de búsqueda para sistemas de IA. Mientras Bing nació para ayudar a las personas a buscar en la web, Web IQ apunta a que los agentes encuentren información correcta, la conviertan en evidencia y la usen dentro de procesos de razonamiento.
Una capa de búsqueda para la era agéntica
La idea central de Web IQ parte de una diferencia operativa. Un usuario humano suele escribir una consulta, revisar resultados y tomar una decisión. Un agente de IA, en cambio, puede consultar varias veces, evaluar evidencia, ajustar su plan y volver a buscar en cuestión de segundos.
Ese patrón exige otra arquitectura. Microsoft afirma que no bastaba con añadir una herramienta de búsqueda a un modelo grande. La empresa asegura que rearquitectó el sistema desde la indexación y la recuperación hasta el ranking, la selección de pasajes y la orquestación.
La base del producto sigue siendo el índice y ecosistema global de Bing. La compañía lo describe como una representación de la web refinada durante décadas mediante infraestructura, asociaciones y criterios sobre inclusión, clasificación, frescura y confianza.
Microsoft también subraya que Web IQ hereda las prácticas de Bing frente a la web abierta. El sistema respeta protocolos de exclusión de robots, controles de editores y preferencias de acceso que definen cómo el contenido puede descubrirse, accederse y utilizarse.
La empresa indicó además que participa en el IETF y otros foros de la industria para ayudar a desarrollar estándares interoperables para la era de la IA. Su objetivo declarado consiste en mantener un ecosistema saludable para proveedores de contenido, anunciantes, desarrolladores y usuarios.
Modelos integrados, embeddings y DiskANN
Sobre esa base, Web IQ usa una capa de modelos con una filosofía particular. En lugar de una gran colección de modelos especializados, Microsoft dice que eligió un número reducido de modelos de alto nivel, estrechamente integrados dentro del sistema.
Estos modelos cumplen funciones coordinadas. Analizan contenido, lo representan en espacios de embeddings, clasifican resultados y seleccionan información para su uso durante la inferencia. En este diseño, cada salida debe servir al razonamiento posterior del modelo de lenguaje.
Uno de los componentes centrales es el modelo de embeddings. Este define cómo se proyecta la información en un espacio donde la similitud semántica puede manejarse computacionalmente. Esa decisión influye en el recall de la recuperación y en el universo de candidatos que evaluarán los componentes siguientes.
La compañía sostiene que ese modelo compite en la parte alta de benchmarks públicos. Sin embargo, el uso práctico dentro de Web IQ apunta a buscar en el vecindario correcto del espacio de información, no solo a ganar una métrica aislada.
La infraestructura también incorpora aprendizajes de DiskANN, un sistema asociado a búsquedas de vecinos más cercanos sobre grandes espacios vectoriales residentes en disco. Microsoft lo presenta como una pieza relevante para operar a gran escala sin sacrificar latencia ni depender de una huella de memoria excesiva.
En Web IQ, la recuperación trabaja sobre particiones distribuidas, rutas globales y optimización de latencia. La empresa recalca que las redes, la ubicación de datos y las rutas de ejecución importan mucho, porque el grounding no ocurre una sola vez dentro de un flujo agéntico.
Menos documentos, más evidencia por token
Una diferencia importante del sistema está en el tipo de respuesta. Web IQ no busca devolver únicamente documentos completos. Su diseño apunta a entregar pasajes y objetos de evidencia estructurados, con mayor densidad de información por token.
Este enfoque responde a una limitación conocida de los modelos de IA. Los documentos largos pueden contener señales valiosas, pero también mucho contexto irrelevante. Enviar todo ese material al modelo aumenta costos, latencia y riesgo de distraer el razonamiento.
Microsoft resume esta estrategia con una frase operativa: menos tokens entran, mejores respuestas salen y menor costo por llamada. La idea no se limita al ahorro. También busca sostener precisión cuando el contexto disponible resulta limitado.
La capa superior de Web IQ actúa como orquestador. Interpreta consultas, despliega la recuperación, fusiona resultados, filtra información y transforma contenidos en evidencia. También combina modalidades y adapta el proceso a la estructura de cada solicitud.
Esta capa no funciona como una simple interfaz externa. La empresa la define como parte del bucle de ejecución del agente de IA. Por eso, la latencia afecta la experiencia del usuario y también la posibilidad de ejecutar múltiples pasos de razonamiento.
Las cifras que Microsoft destaca
La compañía presentó tres ejes para evaluar Web IQ: calidad de grounding, latencia y eficiencia de tokens. Esos factores determinan si un agente puede razonar varias veces contra información externa sin volverse demasiado lento o costoso.
Para medir calidad, Microsoft usa GDSAT, o satisfacción de grounding. La métrica busca capturar si la evidencia satisface la intención del usuario en términos de completitud, frescura y autoridad. La empresa la diferencia de puntuaciones tradicionales de relevancia.
En conjuntos de consultas de producción, Web IQ logra, de acuerdo con la compañía, una mayor satisfacción de grounding que sistemas alternativos en configuraciones comparables. La prueba citada usó 3.000 consultas globales ciegas muestreadas de producción, con una configuración de 10 resultados y 10.000 caracteres por resultado, o equivalente.
La velocidad ocupa el segundo eje. Microsoft reporta una latencia p95 inferior a 165 ms. En sus comparaciones internas, el sistema resultó casi 2,5 veces más rápido que la siguiente mejor alternativa dentro de la cohorte evaluada bajo condiciones similares.
La medición se hizo desde máquinas virtuales alojadas en cinco centros de datos: West US2, North Central US, East US2, North Europe y South Korea. La empresa indica que usó consultas únicas para evitar aciertos de caché, con 10 resultados y 10.000 caracteres por resultado.
El tercer eje es la eficiencia de tokens. Cada token enviado a un modelo implica costo y latencia. Web IQ intenta reducir la cantidad de contexto necesaria para alcanzar un nivel determinado de calidad mediante evidencia a nivel de pasaje.
Para esa evaluación, la empresa menciona otro conjunto de 3.000 consultas globales muestreadas de producción. Las pruebas consideraron 10, 15 y 20 resultados web, además de 3.000, 5.000, 10.000 y 20.000 caracteres por resultado, o equivalentes.
Implicaciones para la IA y los mercados digitales
Web IQ refleja una tendencia más amplia en inteligencia artificial. La competencia ya no gira solo en torno al tamaño de los modelos. También depende de la infraestructura que les permite consultar información actual, verificarla y convertirla en contexto útil.
Para usuarios de mercados financieros y criptomonedas, esta discusión resulta especialmente relevante. Precios, noticias regulatorias, reportes de seguridad y movimientos de actores institucionales cambian con rapidez. Un agente que razona con información vieja puede entregar conclusiones peligrosamente incompletas.
El anuncio también plantea preguntas sobre la relación entre IA y editores. Microsoft intenta posicionar Web IQ como una capa que respeta preferencias de acceso y controles de contenido. Ese punto será crucial a medida que más agentes consuman información web sin interacción humana directa.
La compañía resume sus principios de diseño en cuatro ideas. El grounding requiere una pila completa, una base web global y reciente, evidencia a nivel de pasaje y puntos operativos reales que equilibren calidad, latencia y tokens.
Web IQ apunta, en última instancia, a una web agéntica donde los sistemas de IA razonen contra un mundo reciente, disputado y en constante cambio. La apuesta de Microsoft consiste en que esa próxima década de infraestructura no dependerá solo de modelos más grandes, sino de mejores sistemas para conectarlos con evidencia confiable.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Empresas
Microsoft acelera la IA local en el navegador Edge y abre nuevas API para desarrolladores web
Empresas
Uber limita el uso de herramientas de IA tras agotar su presupuesto anual antes de tiempo
Empresas
OpenAI dice que recaudó USD $122.000 millones y acelera la carrera por cómputo de IA
Empresas