Los costos de la GPU Nvidia Blackwell se duplican, pero el gasto de inferencia por token cae 35 veces frente a Hopper

Según el análisis más reciente del blog de Nvidia, las GPU Blackwell cuestan casi el doble por hora frente a la generación Hopper, pero ofrecen 35 veces menos costos de inferencia por token. Usando DeepSeek-R1 como modelo de prueba, Blackwell (GB300 NVL72) se alquila a 2,65 USD por GPU por hora frente a los 1,41 USD de Hopper, pero el rendimiento de un solo GPU pasa de 90 a 6.000 tokens por segundo. Este salto de rendimiento de 65x reduce los costos por millón de tokens de 4,20 USD a 0,12 USD.

La cifra de 0,12 USD asume optimización completa del software, incluida la inferencia de baja precisión FP4 y la predicción de múltiples tokens (MTP). Sin MTP habilitado, los costos por millón de tokens alcanzan aproximadamente 2,35 USD, bajando a 0,11 USD con él activo, lo que demuestra un impacto de optimización de 21x atribuible solo a esa función.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Forefront Tech completa la fijación de precios de la IPO $100M , para cotizar en Nasdaq

Según ChainCatcher, Forefront Tech Holdings Acquisition Corp completó una fijación de precio de una IPO de 100 millones de dólares el 30 de abril, que cotizará en Nasdaq bajo el ticker FTHAU. Los ingresos se utilizarán para explorar oportunidades de fusiones y adquisiciones en blockchain, inteligencia artificial, fintech y otros

GateNewsHace15m

Exejecutivo de Meta recauda fondos para la startup de IA Flourish con una valoración de 2,5 mil millones de dólares

Según Bloomberg, Thomas Reardon, exejecutivo de Meta que lideró el trabajo en Neural Band de Meta, está recaudando fondos para Flourish, una nueva startup de IA centrada en sistemas de IA de bajo consumo. Lux Capital y Google Ventures han acordado ser inversores principales, con patrocinadores que ya se han comprometido con 500 millones de dólares a una valoración de 2,5

GateNewsHace17m

OpenAI rastrea el problema del “Goblin” hasta una señal de recompensa por personalidad nerd, las menciones de “Goblin” se disparan un 175% en GPT-5.1

Según OpenAI, la empresa identificó la causa raíz del problema del «goblin» que afectó a los modelos GPT desde GPT-5.1 en adelante. Una señal de recompensa utilizada para reforzar el rasgo de personalidad «Nerdy» alentó resultados que incluían referencias a criaturas de fantasía, con el 76,2% del conjunto de datos de entrenamiento mostrando

GateNewshace1h

Parallel Web Systems recauda una $100M Ronda B$2B a una valoración, liderada por Sequoia

Según TechCrunch, Parallel Web Systems, una startup de IA fundada por el exCEO de Twitter Parag Agrawal, recaudó 100 millones de dólares en una ronda de serie B liderada por Sequoia con una valoración de 2 mil millones de dólares. La ronda eleva la financiación total de la empresa a 230 millones de dólares, cinco meses después de su serie A de 100 millones. Parallel

GateNewshace1h

Cena de aniversario de 8 años de BitMart: presenta el trading automatizado con IA y servicios localizados para usuarios en Taiwán

BitMart realizó en Taipei, en el Grand Formosa Regent Taipei, su cena de aniversario número 8, con más de 150 invitados. En el evento se repasó el desarrollo de ocho años y se anunció la estrategia de localización y de operaciones automáticas basada en IA. BitMart Skill, combinado con Blave, permite a los usuarios operar automáticamente con IA y obtener perspectivas de datos en tiempo real sin necesidad de programación. Los usuarios globales superaron los 13 millones, las funciones lanzadas superan las 4.800 y el volumen de operaciones supera 1 billón de dólares. La cena contó con un “Santa Claus” en persona y abundantes regalos, demostrando la determinación de profundizar en Taiwán.

ChainNewsAbmediahace1h

SoftBank planea cotizar Roze en 2026, con un objetivo de valoración de 1000 millones de dólares

De acuerdo con un informe exclusivo del Financial Times (FT) el 30 de abril, SoftBank planea crear en Estados Unidos una nueva compañía independiente llamada Roze, cuyo negocio abarcará la infraestructura de robots de IA y de centros de datos. El objetivo es completar el IPO a más tardar en 2026, con una valoración objetivo fijada en 100 mil millones de dólares. El Financial Times también informó que, dentro de SoftBank, existe preocupación sobre el objetivo de valoración y el calendario del IPO.

MarketWhisperhace1h
Comentar
0/400
Sin comentarios