Beatingによると、LangChainはRubricMiddlewareという新しいDeep Agentsコンポーネントをリリースしており、AIエージェントがあらかじめ設定された基準に照らして自分自身の出力を自動的にレビューし、改善できるようになります。開発者は、コードがテストに通ること、レポートが指定されたセクションをカバーすること、または回答が禁止されている内容を避けることといった完了条件を定義できます。この仕組みは、レビュー用のモデルを起動して各出力をルーブリックに照らして検証し、基準を満たしていなければ、反復が完了するか反復回数の上限に達するまでフィードバックループでエージェントに修正を促します。
この仕組みは、複雑なタスクにおいてエージェントが書式、テスト、引用、またはセクション要件を満たせないというよくある課題に対処します。RubricMiddlewareはタスクのパイプラインに組み込まれた自動品質チェックとして機能し、エージェントが「近似的な答え」を生成するのではなく、本当の完了を理解できるようにします。このアプローチは、俳句の音節数を検証すること、コードのリファクタリングのテストを確認すること、またはレポートの完全性を保証することのように、明確な受け入れ基準があるタスクに特に適しています。