Fundador da SemiAnalysis: Mercado de Inferência de IA Pode Exceder o Petróleo, Tornando-se um dos Maiores Mercados Globalmente

Em 1º de julho, Dylan Patel, fundador da SemiAnalysis, afirmou em uma entrevista ao podcast "Training Data" da Sequoia Capital que a inferência de IA se tornará um dos maiores mercados globais, potencialmente superando o petróleo e representando alguns pontos percentuais do PIB mundial. Ele acredita que o número e o valor das tarefas concluídas após cada iteração do modelo continuam se expandindo a um ritmo mais rápido do que o crescimento da capacidade computacional, sugerindo que pode persistir uma escassez de poder computacional no longo prazo. Patel prevê que, até 2030, a demanda combinada por poder computacional apenas da OpenAI e da Anthropic ultrapassará 100 gigawatts; nos próximos 3 a 5 anos, o impacto dos data centers espaciais ainda será insignificante, mas até 2040, mais da metade da nova capacidade computacional pode ser implantada no espaço. Ele indicou que a restrição central está no custo da energia terrestre e na capacidade de gerar eletricidade. Assim que a economia da implantação espacial superar a dos sistemas terrestres, a migração do poder computacional para o espaço se tornará inevitável. Em relação ao design colaborativo de hardware e software, Patel observou que o aumento na eficiência da IA nos últimos três anos não veio principalmente do hardware, mas sim da otimização colaborativa em nível de modelo e entre camadas. Ele citou a DeepSeek como exemplo, afirmando que a forma do modelo especialista dela é especificamente otimizada para a arquitetura Hopper da NVIDIA, resultando em excelente desempenho no Hopper, mas fraco na TPU; o modelo da Anthropic é mais adequado para TPU, enquanto o modelo da OpenAI pende para a rota da GPU. Ele acredita que o chamado fosso da CUDA não é apenas sobre a CUDA em si, mas sim o ecossistema de modelos de código aberto que geralmente otimiza em torno da colaboração com GPUs. Patel também mencionou que o forte apoio do CEO da NVIDIA, Jensen Huang, a empresas emergentes de computação em nuvem visa evitar que grandes provedores de nuvem monopolizem o cenário do poder computacional e promover um mercado multipolar. Além disso, o sistema de benchmarking de inferência em tempo real InferenceX, construído pela equipe da SemiAnalysis, mostra que, sob qualidade equivalente, os custos de inferência diminuíram aproximadamente 60 vezes ao ano, e a inteligência por watt melhorou cerca de 40 vezes.
DEEPSEEK-0,85%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado