Huawei 950PR desafía a NVIDIA y acelera los modelos de IA de 1 billón de parámetros en China.
***
- El Ascend 950PR ofrece hasta 1.56 PFLOPS en FP4 y memoria de 112-128 GB.
- Supera al H20 de NVIDIA en ciertos workloads de inferencia según Huawei.
- DeepSeek lanzó su V4 de 1.6 billones de parámetros optimizado para este chip en abril.
Huawei ha presentado el Ascend 950PR. Este procesador de IA marca un avance significativo para la industria tecnológica china.
El chip se diseñó principalmente para tareas de inferencia. Forma parte de la serie Ascend 950 y se lanzó junto con el acelerador Atlas 350.
Las restricciones estadounidenses limitan el acceso de China a chips NVIDIA de alto rendimiento. En este contexto, el desarrollo local cobra mayor relevancia.
El 950PR utiliza un diseño de die monolítico fabricado por SMIC. Emplea un proceso N+3 equivalente aproximado a 5 nanómetros.
Este chip alcanza hasta 1.56 PFLOPS en FP4. También llega cerca de 1 PFLOPS en FP8. Representa el primer chip chino con soporte nativo para FP4 en inferencia.
Incorpora entre 112 y 128 GB de memoria HiBL 1.0. Esta es una HBM de desarrollo propio. Su bandwidth alcanza entre 1.4 y 1.6 TB/s.
La interconexión LingQu ofrece hasta 2 TB/s. Esto supera en 2.5 veces a la generación anterior 910.
Su TDP se sitúa en 600W dentro del Atlas 350. Incluye mejoras en acceso a memoria con granularidad reducida a 128 bytes.
Huawei planea enviar alrededor de 750.000 unidades del 950PR durante 2026. La producción en masa comenzó en abril. Los envíos a gran escala se esperan en la segunda mitad del año.
Los precios estimados oscilan entre 50.000 y 70.000 yuanes. Esto equivale aproximadamente a USD $7.000-10.000. Resulta mucho más accesible que alternativas extranjeras.
Comparación técnica con NVIDIA H100 y Blackwell B200
El NVIDIA H100 ofrece alrededor de 989 TFLOPS en FP16. En FP8 puede alcanzar cerca de 4 PFLOPS en modo sparse. Cuenta con 80 GB de HBM3 y bandwidth de 3.35 TB/s.
El Ascend 950PR destaca en precisión FP4 para inferencia. Ofrece mayor capacidad de memoria en algunos escenarios. Sin embargo, queda por detrás en bandwidth total.
Según Huawei, el 950PR logra hasta 2.87 veces más rendimiento que el H20. El H20 es la versión restringida disponible en China.
El NVIDIA Blackwell B200 representa la última generación. Incluye 192 GB de HBM3e con bandwidth de 8 TB/s. Puede alcanzar hasta 9.000 TFLOPS en FP4.
El 950PR no iguala las especificaciones brutas del B200. Aun así, ofrece una alternativa viable para inferencia a gran escala dentro de China.
Las sanciones bloquean el acceso a los chips más avanzados de NVIDIA. Esto hace que la disponibilidad local del 950PR sea una ventaja clave.
El ecosistema software CANN de Huawei sigue madurando. Aunque aún queda camino por recorrer frente a CUDA, las optimizaciones específicas mejoran el rendimiento.
Impacto en los lanzamientos de modelos LLM de 1 billón de parámetros
El 24 de abril se produjo un lanzamiento relevante. DeepSeek presentó su modelo V4. Incluye una versión Pro con 1.6 billones de parámetros en arquitectura MoE.
Este modelo soporta contexto de 1 millón de tokens. Se optimizó nativamente para la plataforma Ascend 950PR.
Grandes empresas chinas como Alibaba, ByteDance y Tencent compiten ahora por estos chips. Otros desarrolladores como Zhipu, Qwen y ERNIE adaptan rápidamente sus modelos.
Analistas señalan que la madurez del stack Ascend acelera el ecosistema de IA local. Las compañías ya no dependen exclusivamente de hardware extranjero.
Huawei proyecta ingresos cercanos a USD $12.000 millones en chips de IA para 2026. Esto representa un aumento del 60 por ciento respecto al año anterior.
El 950PR captura una porción importante del mercado chino de aceleradores. Su soporte para FP4 y memoria propia reduce costos operativos.
Este avance fortalece la autonomía tecnológica de China. Demuestra cómo las restricciones externas impulsan la innovación interna.
Persisten brechas en software y eficiencia a escala comparado con NVIDIA. No obstante, el momentum actual es notable en inferencia y modelos open-source.
El DeepSeek V4 se lanzó bajo licencia MIT. Esto facilita su adopción en la comunidad de desarrolladores.
Para el sector de criptomonedas y memestocks, estos desarrollos implican diversificación en cadenas de suministro. También generan potencial volatilidad en acciones como las de NVIDIA.
En resumen, el Ascend 950PR no solo compite. Se convierte en catalizador para una nueva fase de la IA china.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público. Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Hardware
La IA entra en una nueva fase mientras chips, robots y mercados se reordenan
Empresas
Pentágono firma acuerdos con Nvidia, Microsoft y AWS para llevar IA a redes clasificadas
Análisis de mercado
WLD cae 3,83% en 24 horas ante volumen estable
Análisis de mercado