Em 4 de maio, o modelo central de grandes linguagem da ByteDance, o Douyin, anunciou a introdução de planos de assinatura pagos ao lado do seu nível gratuito, segundo reportagem da 澎湃新闻 (The Paper). A medida marca um possível fim da era de acesso gratuito para modelos de IA chineses e reflete a crescente demanda por capacidades avançadas em tarefas complexas.
O Douyin vai oferecer três níveis de assinatura com opções de cobrança mensal e anual:
A estrutura de preços foi encontrada na página do AppStore do Douyin, que incluía uma declaração de serviço detalhando as ofertas pagas.
A equipe oficial do Douyin respondeu ao The Paper, afirmando: “O Douyin continuará a oferecer serviços gratuitos. Com base nas ofertas gratuitas, o Douyin está explorando serviços adicionais com valor agregado para atender às necessidades diferenciadas dos usuários. Os detalhes dos planos relacionados estão atualmente em fase de testes e serão divulgados por canais oficiais após o lançamento formal.”
De acordo com fontes próximas ao Douyin, os recursos pagos vão se concentrar em tarefas complexas e cenários de produtividade, incluindo:
À medida que as capacidades dos modelos avançam, o Douyin agora consegue lidar com tarefas cada vez mais complexas e de alto valor. No entanto, essas tarefas exigem mais recursos computacionais e mais tempo de inferência, levando a empresa a introduzir serviços pagos para atender à demanda, mantendo o acesso gratuito para as necessidades do usuário no dia a dia.
Em março de 2025, o modelo de grandes linguagem do Douyin atingiu 1,2 quatrilhão de tokens em uso diário, o que representa um crescimento de 1.000x desde seu lançamento em maio de 2024 e uma duplicação nos três meses anteriores, segundo a Volcano Engine (divisão de nuvem da ByteDance). Na plataforma da Volcano Engine, o número de empresas com uso cumulativo de tokens superior a um trilhão cresceu de 100 empresas no fim de 2024 para 140 empresas.
O VP da Volcano Engine, Tan Dai, havia abordado anteriormente a estratégia de precificação de modelos grandes, observando que aumentos de preço refletem melhorias de capacidade: “As diferenças no preço do token refletem fundamentalmente diferenças de capacidade. Modelos da próxima geração são mais poderosos; os custos por token vão subir, mas o valor econômico criado aumentará proporcionalmente. Aumentos de preço impulsionados pela melhoria da inteligência do modelo, em última análise, geram mais valor para os clientes.”
O modelo pago do Douyin segue padrões já estabelecidos globalmente e no mercado doméstico. O ChatGPT da OpenAI oferece acesso por níveis (Free, Go, Plus, Business, Enterprise) com variações de preços por região. Concorrentes como Anthropic e Grok também lançaram versões de assinatura paga.
Na China, modelos líderes como Zhipu e DeepSeek já operam com modelos pagos de assinatura. Ainda assim, as estratégias de preços divergem: a Zhipu aplicou três aumentos de preço de API em 2025 apenas. Em 12 de fevereiro, a Zhipu elevou o preço do GLM Coding Plan em 30% ou mais, citando “demanda forte sustentada do mercado e crescimento rápido da base de usuários e do volume de chamadas”. Em 16 de março, a Zhipu lançou o GLM-5-Turbo com aumento de 20% no preço, seguido de novo aumento de 10% em 8 de abril com o GLM-5.1.
Em contraste, a DeepSeek anunciou cortes significativos de preços em 25 de abril, oferecendo um desconto de 75% por tempo limitado no preço da API V4-Pro. Em 26 de abril, a DeepSeek reduziu ainda mais os preços de tokens de entrada em cache em toda a sua linha de APIs para um décimo do preço original, com descontos para o modelo Pro se estendendo até 5 de maio de 2026. Após o ajuste de preços: DeepSeek-V4-Flash por ¥0,02 por milhão de tokens de entrada em cache e DeepSeek-V4-Pro por ¥0,025 por milhão de tokens.
As estratégias de preços divergentes — a Zhipu elevando e a DeepSeek cortando — refletem julgamentos independentes do mercado, e não uma tendência do setor como um todo.