
A série Qwen (Qwen) da Alibaba lançou esta semana o modelo Qwen3.7-Plus. O preço de entrada é de 0,40 USD por milhão de tokens, e o de saída é de 1,60 USD por milhão de tokens, totalizando 2,00 USD; trata-se de uma descida de 80% face ao Qwen3.7-Max. O preço de entrada em cache pode ser tão baixo quanto 0,04 USD por milhão de tokens, com cenários-alvo para tarefas de alta frequência e com elevada repetição.
De acordo com os dados de preços divulgados pela Alibaba:
Entrada geral: 0,40 USD por milhão de tokens
Saída geral: 1,60 USD por milhão de tokens
Total (entrada + saída): 2,00 USD
Entrada em cache: 0,04 USD por milhão de tokens (aplicável a cenários de agent com leitura repetida do mesmo repositório de código ou de UI empresarial)
Ponto de comparação: Qwen3.7-Max — entrada de 2,50 USD, saída de 7,50 USD, total de 10,00 USD. Concorrentes chineses em oferta limitada: MiniMax-M3 com total de 1,50 USD; o preço do Qwen3.7-Plus fica muito próximo desse valor.
A seguir estão os números de testes de referência do Qwen3.7-Plus publicados oficialmente pela Alibaba, sendo todos dados de autoavaliação:
Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max é 67,9, Gemini-3.1 Pro é 63,5)
ScreenSpot Pro (visão computacional e compreensão de interface): 79,0 (GPT-5.4 xhigh é 67,4, Claude-Opus-4.6 é 49,5)
Importa notar que a documentação oficial da Alibaba também indica que o desempenho global do Qwen3.7-Plus continua abaixo da maioria dos modelos líderes de código fechado dos EUA; os números acima são comparações pontuais para tarefas específicas e não representam desempenho abrangente.
O Qwen3.7-Plus não disponibiliza pesos de modelos abertos para download; todas as chamadas de API precisam de ser processadas através de nós internacionais da Alibaba Cloud, e os dados circulam fora dos servidores do utilizador. Com base nesta arquitetura, existem obstáculos claros de conformidade nos seguintes cenários:
Indústrias sujeitas a restrições de soberania de dados ou regulamentação: saúde (HIPAA, GDPR), defesa, organismos governamentais — é necessário avaliar se o encaminhamento da API externa cumpre os requisitos de conformidade
Cenários de implementação com isolamento na rede interna: não é possível implementar num ambiente local totalmente isolado
Por outro lado, a vantagem do modo de API de código fechado está em não exigir a construção de um cluster próprio de múltiplas GPUs (como Nvidia H100), incluindo a compra e manutenção de hardware; além disso, o formato compatível com OpenAI minimiza os custos de alteração da infraestrutura existente.
O preço em cache aplica-se a cenários em que um agent lê repetidamente a mesma entrada, por exemplo, acesso contínuo ao mesmo repositório de código, modelos de UI empresariais fixos ou prompts do sistema mantidos durante longos períodos. Em fluxos de trabalho grandes e de elevada frequência com tarefas repetitivas, o mecanismo de cache pode reduzir significativamente os custos globais de API. A Alibaba não divulgou quaisquer garantias concretas de taxa de acerto de cache nem detalhes sobre limitações de utilização.
As versões anteriores da série Qwen foram lançadas com licença Apache 2.0, disponibilizando pesos de modelos descarregáveis e permitindo que qualquer pessoa os implemente localmente, faça fine-tuning e os integre nos seus próprios sistemas. O Qwen3.7-Plus é fornecido apenas via API da Alibaba Cloud, não disponibilizando pesos de modelos; isto significa que não é possível implementar localmente ou em redes isoladas, e que toda a utilização depende da infraestrutura externa da Alibaba Cloud.
A explicação oficial do Qwen3.7-Plus indica de forma clara que benchmarks como o Terminal Bench e o ScreenSpot Pro são números de autoavaliação da Alibaba, e que o desempenho global continua abaixo da maioria dos modelos de código fechado líderes nos EUA. Os números dos testes de referência refletem o desempenho pontual em tarefas específicas e não representam a latência fim-a-fim, a estabilidade ou o desempenho abrangente em ambientes de produção reais.
Notícias relacionadas
A Microsoft Build lançou 7 modelos de IA, com uma utilização de tokens 60% inferior à dos concorrentes
As ações da Cisco sobem 5% num dia, a meta de encomendas de IA sobe para 9 mil milhões de dólares
A Google Lança $80B Financiamento por Ações com o $10B Investimento da Berkshire
Os detalhes da marca Dragonfly da Qualcomm são adiados para 24 de junho, com as ações a cair mais de 8% antes da abertura