Beatingによれば、Prime Intellectは一般的エージェントをオープンソース化しており、デュアルプレイヤーのタスク生成メカニクスを用いる自己進化型のエージェント訓練環境だ。システムは、タスク合成器とソルバーを交互に用いることで、自動的に4,504件のタスクと8,000を超える一意のツールを生成し、制約条件、ノイズのある指示、クロスエンティティ結合などを含む9つの戦略によって、課題を5段階の難易度ティアに分類した。
テストでは、環境から得た4,400+の軌跡に対して30Bパラメータのモデルを微調整した結果、BFCLベンチマークでツール呼び出し精度が18.9%から52.3%へと向上し、手作業で注釈された固定データセットに依存せずに、意味的に検証済みの訓練データを生成できる枠組みであることを示した。