10:40
Alpha Arena nova temporada de batalha: 8 grandes modelos da bolsa americana em tempo real estão temporariamente "totalmente derrotados", Grok 4 com uma perda de 56% na última posição.
Mensagem do ChainCatcher, a nova temporada da Alpha Arena começou no dia 20. Até o momento da redação, os 8 grandes modelos de IA participantes falharam completamente, com o GPT-5.1 ocupando o primeiro lugar com uma taxa de retorno de -7,78%, enquanto o Grok 4 ficou em último lugar com uma taxa de retorno de -56%. A nova modelo nacional Kimi 2 apresenta uma taxa de retorno de -32,8%.
Os modelos desta temporada devem participar de várias competições, cada uma com um tema diferente. No geral, essas competições servem como um teste de estresse para os modelos e podem refletir sua robustez em relação a diferentes prompts. No entanto, em uma mesma competição, todos os modelos receberão a mesma entrada. A forma da competição desta temporada é investir em tokens de ações dos EUA em tempo real na trade.xyz.

