Elon Musk: Se espera que el modelo base Grok V9-Medium (1.5T) se lance oficialmente en 2 a 3 semanas

Según la monitorización de Beating, Musk indicó que el modelo base Grok V9-Medium (1.5T) ha completado su entrenamiento. Los resultados de la evaluación son buenos. Se ha añadido una gran cantidad de datos Cursor en el entrenamiento adicional, y se continuará agregando en el futuro. El trabajo de ajuste fino está en curso, y el aprendizaje reforzado comenzará en unos días. Se espera que se lance oficialmente en 2 a 3 semanas. En comparación con el modelo V8-Small de 0.5T que actualmente maneja todo el tráfico de producción de Grok, esto será una mejora significativa, especialmente en tareas complejas de codificación.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
GateUser-78b4adc8
· hace2h
1.5T de parámetros, finalmente se atrevieron a invertir en componentes
Ver originalResponder0
AirdropMileCounter
· hace2h
V8-Small ha estado generando tráfico durante tanto tiempo, trabajo duro confirmado
Ver originalResponder0
GateUser-6bc62511
· hace2h
Las tareas de codificación complejas son el enfoque principal, GitHub Copilot es peligroso
Ver originalResponder0
AirdropCheck-InOfficer
· hace2h
La capacitación adicional todavía está agregando datos, esta velocidad de iteración es demasiado competitiva.
Ver originalResponder0
SlothSignal
· hace2h
Después de iniciar el aprendizaje por refuerzo, parece que volverá a inundar las pantallas con varios benchmarks
Ver originalResponder0
GateUser-03ce08c7
· hace2h
¿2-3 semanas? La velocidad del tiempo de Elon no es la misma que la de la Tierra, ¿verdad?
Ver originalResponder0
AlphaAfterTea
· hace2h
Los datos de Cursor se alimentan, la capacidad de código debe despegar.
Ver originalResponder0
  • Fijado