Olvida la AGI—Los Mejores Modelos de IA Aún Luchan con las Matemáticas
En breve
MATHVISTA, construido con más de 6,000 puntos de datos anotados de Sahara AI, prueba modelos de IA en razonamiento matemático multimodal. GPT-4V obtuvo un 49,9 %, el resultado más alto entre 12 modelos probados, pero aún 10,4 puntos porcentuales por debajo del rendimiento humano. Los investigadores dicen que el progreso hacia la IA general aún es limitado.
Decrypt·03-18 12:10


