D’après Beating, LangChain a publié un nouveau composant Deep Agents appelé RubricMiddleware, qui permet aux agents IA d’examiner et d’affiner automatiquement leurs propres sorties en les comparant à des standards prédéfinis. Les développeurs peuvent définir des critères d’achèvement comme le fait que le code passe des tests, que les rapports couvrent des sections spécifiées, ou que les réponses évitent du contenu interdit. Le système déclenche un modèle d’évaluation pour valider chaque sortie par rapport à la grille ; si les standards ne sont pas respectés, des boucles de rétroaction reviennent à l’agent pour révision jusqu’à ce qu’il passe, ou jusqu’à atteindre des limites d’itération.
Ce mécanisme répond à un défi courant : dans les tâches complexes, les agents ne respectent pas les exigences de mise en forme, de test, de citation ou de sections. RubricMiddleware agit comme un contrôle qualité automatisé intégré dans le pipeline de la tâche, aidant les agents à comprendre ce qu’est une vraie complétion plutôt que de générer des réponses approximatives. Cette approche convient particulièrement aux tâches assorties de critères d’acceptation clairs, comme vérifier le nombre de syllabes d’un haïku, confirmer des tests de refactorisation de code, ou garantir l’exhaustivité d’un rapport.