De acordo com a análise mais recente no blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam custos de inferência por token 35 vezes mais baixos. Usando o modelo de teste DeepSeek-R1, a Blackwell (GB300 NVL72) é alugada a 2,65 USD por GPU por hora, face aos 1,41 USD da Hopper, mas o throughput de um único GPU salta de 90 para 6.000 tokens por segundo. Este ganho de throughput de 65x reduz os custos por milhão de tokens de 4,20 USD para 0,12 USD.
O valor de 0,12 USD assume optimização total de software, incluindo inferência com baixa precisão FP4 e previsão multi-token (MTP). Sem MTP activado, os custos por milhão de tokens atingem aproximadamente 2,35 USD, descendo para 0,11 USD com ele ativo, demonstrando um impacto de optimização de 21x apenas com essa funcionalidade.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Forefront Tech conclui a definição de preços do IPO $100M , para cotar na Nasdaq
De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a fixação do preço de um IPO de 100 milhões de dólares a 30 de abril, com estreia prevista na Nasdaq sob o símbolo FTHAU. Os proventos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras
GateNews27m atrás
Ex-executiva da Meta angaria fundos para a startup de IA Flourish numa valorização de 2,5 mil milhões
Segundo a Bloomberg, Thomas Reardon, ex-executivo da Meta que liderou o trabalho na Neural Band da Meta, está a angariar fundos para a Flourish, uma nova startup de IA focada em sistemas de IA de baixo consumo. A Lux Capital e a Google Ventures acordaram ser investidores de referência, com investidores já a comprometer 500 milhões de dólares a uma avaliação de 2,5
GateNews29m atrás
OpenAI Rastreia o Problema do Goblin até um Sinal de Recompensa da Personalidade “Nerd”, As Menções a Goblin Disparam 175% no GPT-5.1
De acordo com a OpenAI, a empresa identificou a causa raiz do problema dos “goblins” que afetou os modelos GPT a partir do GPT-5.1. Um sinal de recompensa usado para reforçar a característica de personalidade “Nerdy” incentivou resultados que incluíam referências a criaturas de fantasia, com 76,2% do conjunto de dados de treino a mostrar
GateNews1h atrás
A Parallel Web Systems levanta uma $100M Série B $2B , com uma avaliação , liderada pela Sequoia
De acordo com a TechCrunch, a Parallel Web Systems, uma startup de IA fundada pelo antigo CEO do Twitter Parag Agrawal, angariou 100 milhões de dólares numa ronda de Série B liderada pela Sequoia, avaliando a empresa em 2 mil milhões de dólares. A ronda eleva o financiamento total da empresa para 230 milhões de dólares, cinco meses depois da sua Série A de 100 milhões de dólares. Parallel
GateNews1h atrás
Jantar de celebração do 8.º aniversário da BitMart Exchange: introdução de negociação automatizada com IA e serviços localizados para utilizadores em Taiwan
A BitMart realizou um jantar de celebração do 8.º aniversário no Taipei Grand Hotel, em Taiwan, com mais de 150 convidados. O evento fez um balanço do desenvolvimento ao longo de oito anos e anunciou a aposta na localização e em estratégias de negociação automática com IA. A BitMart Skill, em conjunto com a Blave, permite que os utilizadores, sem necessidade de programação, realizem negociações automáticas com IA e obtenham, em tempo real, perceções sobre os dados. A base global de utilizadores ultrapassou os 13 milhões, os produtos em linha já superam os 4.800 e o volume de transações atingiu mais de 1 trilião de dólares. O jantar teve um Pai Natal ao vivo e prémios abundantes, demonstrando a determinação de se aprofundar no mercado de Taiwan.
ChainNewsAbmedia1h atrás
A SoftBank planeia lançar a Roze na bolsa em 2026, com uma avaliação-alvo de 1000 mil milhões de dólares
De acordo com uma reportagem exclusiva do Financial Times (FT) de 30 de abril, a SoftBank está a planear desmembrar nos EUA a criação de uma nova empresa independente chamada Roze, com atividades que incluem robôs de IA e infraestruturas de centros de dados, com o objetivo de concluir um IPO o mais rapidamente possível em 2026, com uma avaliação-alvo fixada em 100 mil milhões de dólares. O Financial Times refere também que, dentro da SoftBank, existem dúvidas quanto à avaliação-alvo e ao calendário do IPO.
MarketWhisper1h atrás