La adopción de Grok dentro del gobierno de EE. UU. sigue siendo marginal, mientras competidores como ChatGPT, Claude, Gemini son más usados, aún cuando investigaciones sugieren que todos siguen siendo poco fiables para responder preguntas de noticias y elecciones. El contraste golpea la narrativa de crecimiento de xAI.
***
- Documentos federales de 2025 muestran solo 3 casos públicos de uso de xAI o Grok, frente a 234 vinculados con tecnología basada en OpenAI.
- Estudios recientes alertan que los principales chatbots todavía fallan con frecuencia al citar noticias, atribuir fuentes y responder preguntas electorales.
- El escenario combina presión comercial, dudas regulatorias y riesgos de desinformación justo antes de las elecciones de mitad de mandato de 2026.
La carrera por dominar la inteligencia artificial (IA) no se está jugando solo en laboratorios y centros de datos.
También se define en oficinas públicas, contratos federales y, cada vez más, en la forma en que millones de personas consumen noticias. En ese terreno, Grok, el chatbot de xAI, enfrenta dos problemas simultáneos: una adopción muy limitada dentro del gobierno de Estados Unidos y un clima creciente de desconfianza sobre la capacidad de los chatbots para informar con precisión sobre asuntos electorales.
Ambas señales son relevantes para el mercado porque afectan la historia de crecimiento que rodea a SpaceX y a su subsidiaria de IA. La compañía ha vinculado parte de su proyección futura a un mercado multibillonario de servicios de inteligencia artificial. Sin embargo, los datos disponibles muestran que el entusiasmo institucional por Grok sigue rezagado frente a OpenAI, Google y Anthropic, mientras nuevas investigaciones ponen en duda la fiabilidad de toda la generación actual de asistentes conversacionales para tareas informativas sensibles.
Grok no logra despegar en Washington
Según un reporte de Reuters, los registros consolidados del inventario de IA de 2025 de las agencias federales muestran más de 400 ejemplos identificados públicamente de uso de IA que mencionan a un proveedor específico. De ellos, solo 3 implican el uso de xAI o Grok. La diferencia frente a otros actores del sector es amplia.
Dentro de esa misma base, 234 casos involucraban tecnología basada en modelos de OpenAI, incluyendo ChatGPT, Codex y Microsoft Copilot. Otros 33 casos estaban vinculados con Gemini u otros productos de Alphabet. Además, 26 hacían referencia a Claude, de Anthropic, aunque ese modelo posteriormente fue vetado por la administración Trump.
Grok ha estado disponible para las agencias federales durante ocho meses a un costo de USD $0,42 por agencia. Ese precio, cercano a cero, forma parte de una estrategia conocida en el sector tecnológico: incentivar el uso inicial para luego facilitar contratos más grandes y costosos. Valerie Wirtschafter, investigadora de Brookings Institution, explicó que la meta es fomentar la adopción hasta que los empleados públicos no imaginen trabajar sin IA generativa.
Ese objetivo todavía parece lejano para xAI. En la Oficina de Administración de Personal y en el Departamento de Salud y Servicios Humanos, Grok se usaba para tareas de bajo nivel, como redactar primeros borradores de documentos o apoyar publicaciones en redes sociales. Un portavoz de la Oficina de Administración de Personal indicó que Microsoft Copilot es la herramienta de IA más usada en esa agencia.
La promesa de SpaceX choca con datos modestos
La debilidad de Grok en Washington importa porque SpaceX ha presentado a la inteligencia artificial como una de sus mayores apuestas de expansión. En una presentación regulatoria reciente, la empresa dijo que espera ganar mucho más dinero construyendo IA para grandes compañías y otras grandes organizaciones que con cualquiera de sus otros negocios, y valoró esa oportunidad total de mercado en USD $26,5 billones.
La narrativa acompaña una valoración esperada de USD $1,75 billones para su oferta pública inicial, que podría convertirse en la mayor de la historia. Pero varios observadores ven la baja penetración de Grok en el gobierno federal como una advertencia sobre su capacidad real para quitar cuota de mercado a competidores ya consolidados.
Vineet Jain, cofundador y director ejecutivo de Egnyte, dijo que la falta de entusiasmo del gobierno de Estados Unidos por Grok funciona como un “canario en la mina de carbón”. A su juicio, eso sugiere que el modelo no ofrece todavía el rigor de seguridad exigido a nivel federal, un punto que podría activar alertas entre compradores corporativos.
Jain fue más lejos al afirmar que, sin validación gubernamental, la valoración de USD $1,75 billones parece menos un piso y más un techo muy alto. La frase resume un problema central para xAI: el gobierno suele funcionar como vitrina de confianza para tecnologías que luego buscan venderse al sector privado.
Pilotos limitados y preferencia por otros modelos
La segunda parte del inventario federal, centrada en aplicaciones más ambiciosas y usadas por menos personas, también ofrece poco espacio para Grok. Las únicas 3 referencias detectadas mostraban que el chatbot había sido desplegado en una capacidad limitada de prueba o piloto en el Laboratorio Nacional Lawrence Livermore del Departamento de Energía y en la Comisión de Asistencia Electoral.
En contraste, OpenAI y Microsoft sumaban juntos 140 casos de uso en ese conjunto. El Pentágono no aparece en este inventario, aunque mantiene un acuerdo de USD $200 millones con xAI. A comienzos de este año, el secretario de Defensa Pete Hegseth anunció la incorporación de Grok a GenAI.mil, el centro no clasificado de las fuerzas armadas para uso de modelos de IA.
Sin embargo, incluso dentro del entorno militar persisten dudas. Una fuente del Pentágono con conocimiento directo del tema dijo que muchos empleados preferían herramientas rivales antes que Grok. En DARPA, por ejemplo, Gemini de Google se usa para análisis de ingeniería, mientras Claude es preferido para codificación, redacción e investigación. OpenAI también tiene presencia, pero Grok no suele ser la primera opción.
La misma fuente afirmó que Claude o Gemini son usados en los círculos de ingeniería más sofisticados de DARPA, en parte porque Grok “simplemente no es el mejor modelo que existe”. Ese comentario no equivale a una evaluación definitiva del producto, pero sí refleja una percepción interna que puede pesar sobre futuras decisiones de compra.
Obstáculos en el sector público y señales débiles en empresas
xAI también intenta avanzar en los requisitos formales del sector público. La compañía comenzó recientemente a buscar la autorización FedRAMP High, una certificación clave para trabajos gubernamentales sensibles, con ayuda del Departamento de Agricultura de Estados Unidos. Aun así, tres profesionales de TI del USDA dijeron no conocer uso alguno de Grok en sus operaciones cotidianas.
Además, el mes pasado xAI perdió una oferta para construir un producto basado en Grok para el Departamento de Asuntos de los Veteranos. De acuerdo con una persona familiarizada con el asunto, el chatbot no cumplió los requisitos del departamento. El episodio se suma a la percepción de que la compañía todavía está tratando de abrirse paso.
La debilidad no parece limitarse al aparato federal. Datos actualizados de la firma Netskope entregados a Reuters muestran que el uso empresarial de Grok cayó a 2 de cada 1.000 usuarios, desde un máximo previo de 5 por cada 1.000. Ray Canzanese, ejecutivo de la firma, señaló que incluso quienes usan Grok pasan menos de la mitad del tiempo que los usuarios de ChatGPT dedican al modelo de OpenAI.
Para Canzanese, esas cifras apuntan a que el chatbot “simplemente no va a entrar en la corriente principal de la América corporativa”. Si esa lectura se confirma, la tesis de crecimiento acelerado de xAI podría enfrentar más presión, en especial si los competidores continúan fortaleciendo sus ecosistemas empresariales y gubernamentales.
Los chatbots tampoco convencen como brújula informativa para votantes
Al problema comercial de Grok se suma una advertencia más amplia para toda la industria. Un análisis publicado por The Next Web retoma una línea de investigaciones que concluye que ChatGPT, Claude, Gemini y Grok todavía no están listos para orientar con fiabilidad a los votantes estadounidenses sobre noticias, centros de votación o afirmaciones de campaña.
Uno de los antecedentes más citados proviene de un experimento del Tow Center de la Columbia Journalism School. El equipo evaluó ocho productos de búsqueda con IA con 200 artículos de noticias distribuidos entre 20 editores. En 1.600 consultas, los modelos respondieron incorrectamente más del 60% de las veces. ChatGPT Search fue completamente preciso en apenas el 28% de los casos y completamente erróneo en el 57%.
Perplexity registró la menor tasa de fallos del grupo, con 37%, pero eso no elimina el problema de fondo. Un resumen de un estudio de Bloomberg publicado el 20 de mayo confirmó que ChatGPT, Claude, Gemini y Grok siguen siendo poco fiables cuando se les consulta sobre noticias, incluidas noticias electorales. Nieman Lab también concluyó que ChatGPT continúa siendo el peor de los cuatro al atribuir correctamente los medios de donde extrae información.
El deterioro no parece haberse detenido. NewsGuard encontró que los diez principales chatbots de IA generativa devolvían afirmaciones falsas ante prompts de noticias el 35% de las veces en agosto de 2025, frente al 18% del año anterior. Ese aumento complica el panorama a 167 días de las elecciones de mitad de mandato de 2026, cuando una nueva cohorte de votantes podría usar chatbots como interfaz primaria de noticias.
Un riesgo estructural para la integridad informativa
El punto central de estas investigaciones no es solo que los modelos “alucinen” de vez en cuando. El problema descrito es más estructural: atribuyen mal citas, fabrican enlaces, citan copias sindicadas o resumidas por IA en vez del trabajo original, y no distinguen de forma fiable entre una nota de una agencia reconocida y un sitio de desinformación que imita formatos periodísticos legítimos.
Según el seguimiento de NewsGuard, los diez principales modelos imitaban afirmaciones de desinformación rusa aproximadamente un tercio del tiempo cuando se enfrentaban a ciertos contenidos noticiosos, citando esos sitios como si fueran fuentes autorizadas. El riesgo es evidente en un contexto electoral, donde una respuesta errónea sobre un centro de votación, una acusación criminal o una encuesta puede parecer convincente para un usuario común.
La raíz del problema, según ese análisis, está en la combinación entre datos de entrenamiento masivos tomados de la web abierta y sistemas de recuperación que pueden priorizar resultados contaminados por reescrituras automáticas, agregadores opacos o vacíos de información. Cuando una noticia real tiene poca cobertura original, la propaganda puede llenar el espacio y volverse material de referencia para el chatbot.
Los acuerdos de licencia firmados por empresas como OpenAI, Google y otras con editores importantes prometen mejorar citas y precisión. Sin embargo, la evidencia pública hasta mayo de 2026 no confirma que eso ya esté ocurriendo. El hecho de que ChatGPT Search haya mostrado una tasa de error total de 57% incluso sobre un corpus con medios licenciados alimenta el escepticismo.
Mercado, regulación y credibilidad en juego
Para los mercados tecnológicos, el mensaje es doble. Por un lado, Grok todavía no demuestra la tracción institucional que respaldaría una historia agresiva de crecimiento para xAI y, por extensión, para SpaceX. Por otro, el problema de fiabilidad afecta también a sus rivales y sugiere que el despliegue comercial de chatbots en sectores sensibles sigue corriendo por delante de la infraestructura de control y verificación.
Fuera de Estados Unidos, la presión regulatoria ya está aumentando. China puso en marcha en abril de 2026 reglas obligatorias de etiquetado y simulación de personalidad. La Unión Europea avanza por su propia vía con la Ley de Servicios Digitales. Ambos marcos buscan exigir procedencia, etiquetado y responsabilidad sobre la desinformación generada dentro de los productos.
En Estados Unidos no existe todavía un esquema federal comparable para texto generado por chatbots. Ese vacío regulatorio deja en manos de las empresas una parte importante de la gobernanza de sistemas que hoy median acceso a noticias, información cívica y decisiones públicas. En un año electoral, esa brecha adquiere otra dimensión.
Así, la baja adopción de Grok en Washington y las fallas documentadas de los principales chatbots en tareas informativas dibujan un mismo telón de fondo. La industria de IA quiere vender estas herramientas como infraestructura crítica para gobiernos, empresas y ciudadanos. Pero la evidencia disponible sugiere que, al menos por ahora, la promesa comercial avanza más rápido que la confianza que exige su uso en contextos de alto impacto.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Estados Unidos
Casa Blanca prepara orden para revisar modelos de IA antes de su lanzamiento
Asia
AMD destinará más de USD $10.000 millones al ecosistema de IA en Taiwán
Bitcoin
Acciones de mineras Bitcoin suben tras resultados récord de Nvidia
IA