
A série Qwen da Alibaba, Qianwen, publicou nesta semana o modelo Qwen3.7-Plus. O preço de entrada é de US$ 0,40 por 1 milhão de tokens e o de saída é de US$ 1,60 por 1 milhão de tokens, totalizando US$ 2,00. Isso representa uma queda de 80% em relação ao Qwen3.7-Max. Para entradas com cache, o preço pode ser reduzido para US$ 0,04 por 1 milhão de tokens, com foco em cenários de tarefas de alta frequência e repetitivas.
Qwen3.7-Plus confirma as tarifas de cobrança em cada modelo
De acordo com as informações de preços publicadas pela Alibaba:
Entrada padrão: US$ 0,40 por 1 milhão de tokens
Saída padrão: US$ 1,60 por 1 milhão de tokens
Total (entrada + saída): US$ 2,00
Entrada com cache: US$ 0,04 por 1 milhão de tokens (aplicável a cenários de agentes com leitura repetida do mesmo repositório de código ou a agentes com cenários de UI empresarial)
Comparativo: o Qwen3.7-Max tem entrada de US$ 2,50, saída de US$ 7,50, totalizando US$ 10,00. Concorrentes chineses, como o MiniMax-M3, oferecem um desconto por tempo limitado, com total de US$ 1,50. O preço do Qwen3.7-Plus fica alinhado de perto com esse valor.
Números de testes de referência oficiais (autoavaliação)
A seguir estão os números de referência do Qwen3.7-Plus publicados oficialmente pela Alibaba; todos são dados de autoavaliação:
Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max é 67,9; Gemini-3.1 Pro é 63,5)
ScreenSpot Pro (visão computacional e compreensão de interface): 79,0 (GPT-5.4 xhigh é 67,4; Claude-Opus-4.6 é 49,5)
Vale notar que a documentação oficial da Alibaba também afirma que o desempenho geral do Qwen3.7-Plus ainda fica abaixo da maioria dos modelos fechados líderes dos EUA. Os números acima são comparações pontuais de tarefas específicas e não representam desempenho abrangente.
Impacto da confirmação de implantação em modelo fechado: considerações de conformidade e limitações de uso
O Qwen3.7-Plus não fornece pesos do modelo de código aberto para download. Todas as chamadas de API precisam ser processadas pelos nós internacionais da Alibaba Cloud; os dados não fluem além do servidor do usuário. Com base nessa arquitetura, os seguintes cenários têm obstáculos claros de conformidade:
Indústrias com restrições de soberania de dados ou regulatórias: saúde (HIPAA, GDPR), defesa e órgãos governamentais exigem avaliação se o roteamento da API externa atende aos requisitos de conformidade
Cenários de implantação com isolamento de rede interna: não é possível implantar em um ambiente local totalmente isolado
Por outro lado, a vantagem do modo de API fechada é que não é necessário construir um cluster próprio de múltiplas GPUs (como Nvidia H100) para aquisição e manutenção de hardware. Além disso, o formato compatível com OpenAI minimiza o custo de alteração da infraestrutura existente.
Perguntas frequentes
Para quais cenários a tarifa de cache de US$ 0,04 por 1 milhão de tokens do Qwen3.7-Plus se aplica?
A tarifa de cache se aplica a cenários em que um agent lê repetidamente a mesma entrada, como acesso contínuo ao mesmo repositório de código, templates fixos de UI empresarial ou prompts do sistema mantidos por longos períodos. Em fluxos de trabalho grandes e de alta frequência e repetitividade, o mecanismo de cache pode reduzir significativamente o custo total de API. A Alibaba não divulgou detalhes específicos sobre garantias de taxa de acerto de cache nem restrições de uso.
Quais são as principais diferenças entre o Qwen3.7-Plus e as versões anteriormente abertas do Qwen?
Antes, a série Qwen era lançada com licença Apache 2.0, permitindo baixar pesos do modelo para implantação local, ajuste fino e integração aos próprios sistemas. O Qwen3.7-Plus oferece acesso apenas via API da Alibaba Cloud, sem publicar pesos do modelo. Isso significa que não é possível implantar localmente ou em redes isoladas; todo uso depende da infraestrutura externa da Alibaba Cloud.
Como interpretar a credibilidade dos números de testes de referência oficiais do Qwen3.7-Plus?
A descrição oficial do Qwen3.7-Plus deixa claro que ranqueamentos como Terminal Bench e ScreenSpot Pro são números de autoavaliação da Alibaba, e que o desempenho geral ainda fica abaixo da maioria dos modelos fechados líderes dos EUA. Os números do benchmark refletem desempenho pontual em tarefas específicas e não representam latência fim a fim, estabilidade ou desempenho abrangente em ambientes reais de produção.