Prime Intellect lanza código abierto para un entorno de agente autoevolutivo, genera 8.000+ herramientas y mejora la precisión del uso de herramientas hasta el 52,3%

GateNews

Según Beating, Prime Intellect ha publicado como código abierto un general-agent, un entorno de entrenamiento de agentes autoevolutivos que usa mecánicas de generación de tareas de doble jugador. El sistema generó automáticamente 4.504 tareas y más de 8.000 herramientas únicas alternando entre un sintetizador de tareas y un solucionador, categorizando los desafíos en cinco niveles de dificultad mediante nueve estrategias, incluidas condiciones de restricción, instrucciones con ruido y acoplamiento entre entidades.

En las pruebas, ajustar finamente un modelo de 30B de parámetros con más de 4.400 trayectorias del entorno mejoró la precisión de la llamada a herramientas del 18,9% al 52,3% en el benchmark BFCL, demostrando la capacidad del marco para generar datos de entrenamiento semánticamente verificados sin depender de conjuntos de datos estáticos anotados manualmente.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios