El precio de Ali Qwen3.7-Plus se reduce en un 80%, a cambio de optar por código cerrado y reducir costos

Qwen3.7-Plus降價

La serie Ali Qianwen (Qwen) publicó esta semana el modelo Qwen3.7-Plus; el precio de entrada es de 0,40 dólares/1 millón de tokens y el de salida es de 1,60 dólares/1 millón de tokens, total 2,00 dólares, lo que supone una caída del 80% frente a Qwen3.7-Max; el precio de entrada en caché puede bajar hasta 0,04 dólares/1 millón de tokens. El escenario objetivo son tareas de alta frecuencia con repetitividad.

Confirmación de precios de Qwen3.7-Plus: tarifas para cada modalidad de facturación

Según la información de precios publicada por Alibaba:

Entrada general: 0,40 dólares/1 millón de tokens

Salida general: 1,60 dólares/1 millón de tokens

Total (entrada + salida): 2,00 dólares

Entrada en caché: 0,04 dólares/1 millón de tokens (aplicable a escenarios de agentes con lectura repetida del mismo repositorio de código o de UI empresarial)

Comparativo: Qwen3.7-Max, con entrada de 2,50 dólares, salida de 7,50 dólares, total 10,00 dólares. El competidor chino MiniMax-M3 en oferta por tiempo limitado suma 1,50 dólares; el precio de Qwen3.7-Plus queda muy cerca del de este.

Números de pruebas de referencia oficiales (autoevaluación)

Los siguientes son números de referencia de Qwen3.7-Plus publicados por Alibaba; todos corresponden a datos de autoevaluación:

Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max es 67,9, Gemini-3.1 Pro es 63,5)

ScreenSpot Pro (visión por computador y comprensión de interfaz): 79,0 (GPT-5.4 xhigh es 67,4, Claude-Opus-4.6 es 49,5)

Cabe destacar que la documentación oficial de Alibaba también indica que el desempeño general de Qwen3.7-Plus aún es inferior al de la mayoría de los modelos líderes de EE. UU. de código cerrado; los números anteriores son comparaciones puntuales en tareas específicas y no representan un rendimiento integral.

Confirmación del impacto del despliegue de código cerrado: consideraciones de cumplimiento y limitaciones de uso

Qwen3.7-Plus no ofrece pesos descargables de un modelo abierto; todas las llamadas a la API deben procesarse mediante los nodos internacionales de Alibaba Cloud, y los datos fluyen fuera de los servidores del usuario. Con esta arquitectura, existen obstáculos claros de cumplimiento en los siguientes escenarios:

Industries con restricciones sobre la soberanía de los datos o requisitos legales: salud (HIPAA, GDPR), defensa, organismos gubernamentales; hay que evaluar si el enrutamiento de la API externa cumple con los requisitos de cumplimiento

Escenarios de despliegue aislado en red interna: no se puede desplegar en un entorno local completamente aislado

Por el contrario, la ventaja del modo de API de código cerrado es que no requiere construir un clúster propio de múltiples GPU (como Nvidia H100) para la compra y el mantenimiento de hardware, y el formato compatible con OpenAI minimiza el costo de modificación de la infraestructura existente.

Preguntas frecuentes

¿A qué escenarios se aplica el precio en caché de 0,04 dólares/1 millón de tokens de Qwen3.7-Plus?

El precio de caché aplica a escenarios en los que un agente lee repetidamente la misma entrada, por ejemplo: acceso continuo al mismo repositorio de código, plantillas fijas de UI empresarial o instrucciones del sistema mantenidas durante mucho tiempo. En flujos de trabajo grandes de alta frecuencia y repetitividad, el mecanismo de caché puede reducir significativamente el costo total de la API. Alibaba no ha publicado garantías concretas sobre la tasa de aciertos en caché ni detalles sobre restricciones de uso.

¿Cuáles son las principales diferencias entre Qwen3.7-Plus y las versiones anteriores de Qwen con licencia abierta?

Las versiones anteriores de la serie Qwen se publicaron con licencia Apache 2.0, con pesos descargables del modelo, lo que permite que cualquiera pueda desplegarlo localmente, hacer fine-tuning e integrarlo en sus propios sistemas. Qwen3.7-Plus solo se ofrece mediante la API de Alibaba Cloud; no publica pesos del modelo, lo que significa que no se puede desplegar en local ni en redes aisladas, y que todo uso depende de la infraestructura externa de Alibaba Cloud.

¿Cómo debe interpretarse la credibilidad de los números de pruebas de referencia oficiales de Qwen3.7-Plus?

La documentación oficial de Qwen3.7-Plus indica claramente que los puntajes de pruebas como Terminal Bench y ScreenSpot Pro son números de autoevaluación de Alibaba, y que el rendimiento general aún es inferior al de la mayoría de los modelos de código cerrado líderes en EE. UU. Los números de pruebas de referencia reflejan el rendimiento puntual en tareas específicas, y no representan la latencia de extremo a extremo, la estabilidad o el rendimiento integral en entornos de producción reales.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios