Alibaba Cloud cambia hacia la IA agentica, los ingresos por tokens se disparan 15x en 5 meses

BABA-0,86%

Apertura

Alibaba Cloud anunció el 20 de mayo de 2026 una actualización integral de su sistema tecnológico de extremo a extremo en el Alibaba Cloud Summit, posicionándose para la era del AI Agentic. La compañía presentó nuevos productos, como el sitio web del producto Qwen Cloud, el chip de IA Pangu M890 de fabricación propia integrado en el servidor Panjiu AL128 supernodo, y el modelo insignia Qwen3.7-Max. Este cambio refleja una transformación fundamental de los usuarios principales de la computación en la nube: dado que los agentes de IA operan 24 horas de forma continua con demandas infinitas de IA y de nube, Alibaba Cloud está reestructurando toda su pila tecnológica, desde los chips de capa base, la infraestructura Agentic Cloud, los modelos hasta las plataformas de inferencia. Según ejecutivos de la empresa, los ingresos por IA basados en tokens están listos para reemplazar a ECS (Elastic Compute Service) como la mayor línea de productos de Alibaba Cloud, marcando una transición de los servicios cloud tradicionales a modelos de consumo impulsados por IA. En los últimos cinco meses, el ingreso diario promedio por tokens de Alibaba Cloud ha crecido aproximadamente 15 veces, señalando la aceleración de esta transformación.

Serie de chips de IA Pangu e infraestructura de hardware

Alibaba Cloud lanzó una agresiva hoja de ruta de chips centrada en el Pangu M890, un chip de IA unificado para entrenamiento e inferencia de nueva generación con un rendimiento tres veces superior al de la generación anterior Pangu M810E. El servidor supernodo Panjiu AL128, impulsado por el M890 y equipado con el chip interconector ICN Switch 1.0 desarrollado internamente, permite que 128 chips de IA funcionen como una única unidad de cómputo con una latencia entre pares por debajo de 150 nanosegundos, abordando la inferencia concurrente masiva y las demandas de entrenamiento de modelos grandes en escenarios de agentes.

Alibaba Cloud dio a conocer la hoja de ruta de la serie de chips Pangu, comprometiéndose a lanzar una nueva generación cada año durante los próximos dos años, con lanzamientos planificados de los chips Pangu V900 y Pangu J900 que ofrecerán mayor capacidad de cómputo. A la fecha, la serie Pangu ha entregado de forma acumulada 560.000 chips, dando servicio a más de 400 clientes en más de 20 industrias.

Crecimiento de ingresos por tokens y posición en el mercado

Alibaba Cloud tiene la mayor cuota en el mercado MaaS (Model-as-a-Service) de modelos grandes. La compañía informó que los ingresos por tokens experimentaron una aceleración significativa a partir de este año, y el periodo anterior se caracterizó como apenas un “prólogo”. Según ejecutivos de la empresa, el ingreso diario promedio por tokens aumentó aproximadamente 15 veces durante los últimos cinco meses, reflejando la adopción acelerada de servicios de IA. Esta trayectoria de crecimiento indica que las métricas basadas en tokens se están convirtiendo en la unidad de medición principal para la expansión de ingresos de Alibaba Cloud.

Rediseño de productos cloud para cargas de trabajo de agentes

Alibaba Cloud está rediseñando fundamentalmente sus productos cloud para operar como sistemas nativos de agentes. Los productos cloud tradicionales fueron diseñados pensando en operadores humanos, pero las cargas de trabajo de agentes presentan características incompatibles con la computación en la nube convencional: elasticidad irregular, ciclos de vida cortos y escalado instantáneo. La compañía ha emprendido la “Skill-ification”, la transformación MCP (Model Context Protocol) y la estandarización de la CLI (Command Line Interface) de todos los productos cloud, permitiendo que los agentes invoquen capacidades de la nube como llamadas a funciones estandarizadas.

Este enfoque de rediseño llevó a Alibaba Cloud a lanzar Qwen Cloud, un nuevo sitio web de producto separado del portal principal de Alibaba Cloud. En el sitio, la página de inicio muestra una sola instrucción de prompt legible para agentes. Todas las capacidades de servicio de modelos se encapsulan como Skills y herramientas CLI estandarizadas, permitiendo que los agentes analicen la instrucción, adquieran capacidades completas de la plataforma e invoquen de forma autónoma las funciones necesarias. Según el liderazgo de la compañía, el juicio central que sustenta esta iniciativa es que los usuarios principales de la computación en la nube futura serán agentes de IA y no ingenieros humanos, lo que exige un cambio fundamental en la arquitectura de producto y el diseño de la interacción.

Capacidades y rendimiento del modelo Qwen3.7-Max

Alibaba Cloud lanzó Qwen3.7-Max como su modelo insignia más reciente de lenguaje a gran escala. En el ranking de pruebas ciegas globales de modelos grandes de Arena, Qwen3.7-Max ocupa el primer lugar entre los modelos chinos, superando a Kimi-K2.6, DeepSeek-v4-pro y GLM-5.1, mientras se acerca a los niveles de rendimiento de los modelos más fuertes de GPT, Claude y Gemini.

Un estudio de caso en producción demuestra la capacidad autónoma del modelo más allá de los puntos de referencia estándar. En el chip Pangu M890, una plataforma que el modelo nunca había encontrado durante el entrenamiento, Qwen3.7-Max completó de forma independiente una implementación y tarea de optimización de un kernel de cómputo de IA de nivel producción durante más de 35 horas usando solo una descripción de la tarea, logrando 10 veces el rendimiento de la versión de referencia oficial. Este caso ejemplifica un cambio fundamental en los objetivos de diseño del modelo: pasar de optimizar para la alineación de preferencia humana a optimizar para la finalización autónoma de tareas. De acuerdo con el liderazgo de la división de modelos grandes de Alibaba, Qwen3.7-Max fue diseñado para servir como el núcleo inteligente de los agentes, equipado con capacidades de planificación autónoma, iteración continua y colaboración entre herramientas.

Alibaba Cloud ha identificado la codificación de IA (programación impulsada por IA) como un dominio de aplicación principal. La compañía señala que la Codificación de IA genera nuevas aplicaciones mientras moderniza simultáneamente el código heredado acumulado durante décadas. Ejecutivos de la compañía destacaron que la Codificación de IA se dirige a gastos de desarrollo de software y de subcontratación externa que antes quedaban fuera de la captación de ingresos por servicios cloud tradicional, lo que representa una expansión significativa de la oportunidad de mercado direccionable.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios