O CEO da Coinbase, Brian Armstrong, afirmou na última sexta-feira (26) que a exchange de criptomoedas definiu os modelos de IA de código aberto chineses GLM 5.2 e Kimi 2.7 como os modelos de linguagem grandes padrão para engenheiros internos. Armstrong relatou que a Coinbase reduziu os gastos com IA em quase metade por meio de otimização de roteamento e melhorias de cache, enquanto o uso de tokens continua crescendo exponencialmente. Essa implantação reflete uma tendência mais ampla entre empresas de tecnologia dos EUA que estão integrando discretamente modelos de IA de código aberto chineses em suas infraestruturas de produção para reduzir custos e escalar aplicações.
Armstrong atribuiu a redução de custos a uma reforma de infraestrutura de três camadas. A primeira camada é o "roteamento inteligente", onde o sistema pré-processa prompts e atribui automaticamente as tarefas ao modelo mais adequado e econômico com base nas taxas de acerto do cache e nos preços dos modelos. A segunda camada é o "cache agressivo", que aumentou a taxa de acerto do cache do LibreChat de 5% para 60% ao exigir que todas as solicitações estejam cientes do cache. A terceira camada é o "contexto simplificado", que recomenda abrir novas sessões ao alternar tarefas e reduzir o escopo de arquivos para evitar desperdício de tokens.
Armstrong enfatizou que a abordagem não visa suprimir o uso, mas sim escalar a adoção de IA. Ele descreveu o método como essencial para alcançar uma expansão sustentável do uso de IA, afirmando que qualquer empresa pode adotar esse modelo para permitir que engenheiros usem livremente qualquer quantidade de tokens e modelos sem estabelecer um teto de custos, ao mesmo tempo em que vincula o uso ao impacto nos negócios.
Os dois modelos de código aberto chineses são implantados principalmente para cenários de tarefas rotineiras. Para tarefas que exigem planejamento complexo, os engenheiros ainda podem selecionar modelos de fronteira. No processo de revisão de código, a Coinbase emprega uma estratégia paralela de múltiplos modelos, permitindo que diferentes modelos verifiquem cruzadamente os resultados de saída para manter os padrões de qualidade.
Armstrong observou que, à medida que os custos dos principais serviços de modelos dos EUA continuam a subir, as vantagens de custo-benefício dos modelos de código aberto chineses estão gradualmente mudando as estratégias de implantação de IA das empresas de tecnologia globais.
O que a Coinbase anunciou na última sexta-feira (26) sobre modelos de IA?
O CEO da Coinbase, Brian Armstrong, anunciou que a empresa definiu os modelos de IA de código aberto chineses GLM 5.2 e Kimi 2.7 como os modelos de linguagem grandes padrão para engenheiros internos. Armstrong afirmou que essa mudança, combinada com otimização de roteamento e melhorias de cache, reduziu os gastos com IA em quase metade, enquanto o uso de tokens mantém crescimento exponencial.
Como a Coinbase usa modelos de IA chineses em suas operações?
A Coinbase implanta GLM 5.2 e Kimi 2.7 principalmente para cenários de tarefas rotineiras, enquanto os engenheiros ainda podem selecionar modelos de fronteira para tarefas que exigem planejamento complexo. Na revisão de código, a empresa usa uma estratégia paralela de múltiplos modelos, onde diferentes modelos verificam cruzadamente os resultados de saída para manter os padrões de qualidade.
Eric Schmidt diz que a IA da China agora está atrás dos EUA por 'segundos' enquanto os controles de chips falham
Modelo de IA chinês GLM 5.2 atrai usuários empresariais em busca de alternativas abertas
OpenAI limita modelos GPT-5.6 para parceiros confiáveis a pedido do governo dos EUA
BitGo reduz quase 15% da força de trabalho para focar em stablecoins e IA
Governo dos EUA pede à OpenAI que adie o amplo lançamento do GPT-5.6 por preocupações de segurança.