A Ali reduz em 80% o preço do Qwen3.7-Plus, trocando código fechado por custos mais baixos

Qwen3.7-Plus降價

A série Qwen (Qwen) da Alibaba lançou esta semana o modelo Qwen3.7-Plus. O preço de entrada é de 0,40 USD por milhão de tokens, e o de saída é de 1,60 USD por milhão de tokens, totalizando 2,00 USD; trata-se de uma descida de 80% face ao Qwen3.7-Max. O preço de entrada em cache pode ser tão baixo quanto 0,04 USD por milhão de tokens, com cenários-alvo para tarefas de alta frequência e com elevada repetição.

Confirmação de preços do Qwen3.7-Plus: taxas em cada modo de faturação

De acordo com os dados de preços divulgados pela Alibaba:

Entrada geral: 0,40 USD por milhão de tokens

Saída geral: 1,60 USD por milhão de tokens

Total (entrada + saída): 2,00 USD

Entrada em cache: 0,04 USD por milhão de tokens (aplicável a cenários de agent com leitura repetida do mesmo repositório de código ou de UI empresarial)

Ponto de comparação: Qwen3.7-Max — entrada de 2,50 USD, saída de 7,50 USD, total de 10,00 USD. Concorrentes chineses em oferta limitada: MiniMax-M3 com total de 1,50 USD; o preço do Qwen3.7-Plus fica muito próximo desse valor.

Números de testes de referência oficiais (autoavaliação)

A seguir estão os números de testes de referência do Qwen3.7-Plus publicados oficialmente pela Alibaba, sendo todos dados de autoavaliação:

Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max é 67,9, Gemini-3.1 Pro é 63,5)

ScreenSpot Pro (visão computacional e compreensão de interface): 79,0 (GPT-5.4 xhigh é 67,4, Claude-Opus-4.6 é 49,5)

Importa notar que a documentação oficial da Alibaba também indica que o desempenho global do Qwen3.7-Plus continua abaixo da maioria dos modelos líderes de código fechado dos EUA; os números acima são comparações pontuais para tarefas específicas e não representam desempenho abrangente.

Impacto da confirmação da implementação de código fechado: considerações de conformidade e limitações de aplicabilidade

O Qwen3.7-Plus não disponibiliza pesos de modelos abertos para download; todas as chamadas de API precisam de ser processadas através de nós internacionais da Alibaba Cloud, e os dados circulam fora dos servidores do utilizador. Com base nesta arquitetura, existem obstáculos claros de conformidade nos seguintes cenários:

Indústrias sujeitas a restrições de soberania de dados ou regulamentação: saúde (HIPAA, GDPR), defesa, organismos governamentais — é necessário avaliar se o encaminhamento da API externa cumpre os requisitos de conformidade

Cenários de implementação com isolamento na rede interna: não é possível implementar num ambiente local totalmente isolado

Por outro lado, a vantagem do modo de API de código fechado está em não exigir a construção de um cluster próprio de múltiplas GPUs (como Nvidia H100), incluindo a compra e manutenção de hardware; além disso, o formato compatível com OpenAI minimiza os custos de alteração da infraestrutura existente.

Perguntas frequentes

O preço em cache do Qwen3.7-Plus (0,04 USD por milhão de tokens) aplica-se a que cenários?

O preço em cache aplica-se a cenários em que um agent lê repetidamente a mesma entrada, por exemplo, acesso contínuo ao mesmo repositório de código, modelos de UI empresariais fixos ou prompts do sistema mantidos durante longos períodos. Em fluxos de trabalho grandes e de elevada frequência com tarefas repetitivas, o mecanismo de cache pode reduzir significativamente os custos globais de API. A Alibaba não divulgou quaisquer garantias concretas de taxa de acerto de cache nem detalhes sobre limitações de utilização.

Quais são as principais diferenças entre o Qwen3.7-Plus e as versões anteriores do Qwen com licença aberta?

As versões anteriores da série Qwen foram lançadas com licença Apache 2.0, disponibilizando pesos de modelos descarregáveis e permitindo que qualquer pessoa os implemente localmente, faça fine-tuning e os integre nos seus próprios sistemas. O Qwen3.7-Plus é fornecido apenas via API da Alibaba Cloud, não disponibilizando pesos de modelos; isto significa que não é possível implementar localmente ou em redes isoladas, e que toda a utilização depende da infraestrutura externa da Alibaba Cloud.

Como deve ser interpretada a credibilidade dos números de testes de referência oficiais do Qwen3.7-Plus?

A explicação oficial do Qwen3.7-Plus indica de forma clara que benchmarks como o Terminal Bench e o ScreenSpot Pro são números de autoavaliação da Alibaba, e que o desempenho global continua abaixo da maioria dos modelos de código fechado líderes nos EUA. Os números dos testes de referência refletem o desempenho pontual em tarefas específicas e não representam a latência fim-a-fim, a estabilidade ou o desempenho abrangente em ambientes de produção reais.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário