Hugging Faceがオープンソース化したml-intern:自律型ML研究のためのAIエージェント

Gate Newsメッセージ、4月22日――Hugging Faceは、論文の読み取り、データセットの整理、GPU学習の起動、結果の評価、改善の反復といった一連のワークフローを自律的に完了できるML研究エージェント「ml-intern」をオープンソース化しました。このプロジェクトはHugging Faceのsmolagentsフレームワークに基づいており、CLIとWebベースのインターフェースの両方を提供し、コードはGitHubで公開されています。

ml-internのツールチェーンはHugging Faceのエコシステムを中心に設計されています。arXivとHF Papersから論文を取得し、より深い読みのために引用チェーンをたどります。HF Hub上でデータセットを閲覧し、品質を検証し、学習用にデータを再フォーマットします。さらに、ローカルのGPUリソースが利用できない場合は、HF Jobsを呼び出してクラウドベースの学習タスクを起動します。学習が完了すると、エージェントは評価出力を自動で読み、失敗の原因を診断し、実験を再実行します。デフォルトでは意思決定ループの駆動にClaude Sonnet 4.5を使用し、1回の実行あたり最大300イテレーション、170kトークンを超えた場合は自動でコンテキストを圧縮します。

Hugging Faceは3つのユースケースを示しました。科学的推論のタスクでは、エージェントが引用チェーンからOpenScienceおよびNemoTron-CrossThinkのデータセットを特定し、ARC、SciQ、MMLUから難易度レベル別に7つのバリアントをフィルタリングしたうえで、Qwen3-1.7Bで12ラウンドの教師あり微調整を実行しました。その結果、10時間未満でGPQAスコアが10%から32%へ改善しました。医療アプリケーションでは、エージェントが既存のデータセットが不十分だと判断し、1,100件の合成データサンプルを生成するスクリプトを作成して、それらを学習用に50倍に拡張し、HealthBenchでCodexのパフォーマンスを60%上回りました。競争的な数学のシナリオでは、エージェントがGRPOの学習スクリプトを作成し、HF Spaces経由でA100 GPUで学習を起動した後、報酬が崩壊するのを観測してからアブレーションスタディを実施しました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

OpenAIのグレッグ・ブロックマン:AIはチャットから自律的なタスク実行へ移行

ゲートニュース記事(4月27日)— OpenAIの社長兼共同創業者であるグレッグ・ブロックマンは、次の波の人工知能は、AIボットとチャットするだけの状態から、現実世界のタスクを割り当てることへユーザーを移行させると述べた。 この変化には、企業が業務運用のワークフローを再考し、セキュリティ、管理、コストに関する新しいプロトコルを確立することが必要となる。このため、企業は業務運用のワークフローを再考し、セキュリティ、管理、コストに関する新しいプロトコルを確立する必要がある。

GateNews10分前

大手CEXが1,000+トレーダーデータ付きのスマートマネーシグナルスイートをローンチ

ゲートニュースメッセージ、4月27日—主要な大手集中型取引所が「スマートマネーシグナルスイート」をローンチしました。これは、1,000人以上の人気トレーダーからのリアルタイム保有高、勝率、損益データを統合しています。このツールキットは、プラットフォームのAgent Trade Kitを通じて利用でき、トレーダーのシグナルをAIエージェント呼び出し可能なツールとして

GateNews21分前

B.AIがインフラをアップグレードし、大規模なスキル機能をローンチ

Gate Newsメッセージ、4月27日—B.AIは今週、複数のプロダクトおよびエコシステムの進展を発表しました。BAIclawのランディングページは、完全なビジュアルおよびインタラクションの刷新を受け、Webサイトの多言語対応は10言語に拡張され、グローバルな利用性が強化されました。 インフラ面では

GateNews24分前

AIエージェントが暗号決済の需要を押し上げ、x402は1億6500万件の取引を処理

Gate News メッセージ、4月27日――大手CEXのエグゼクティブであるJesse Pollak氏は、自律型AIエージェントが暗号決済の新たな「需要の中心」を生み出しており、ソフトウェアネイティブの決済インフラが必要だと主張している。4月20日、x402エコシステムが165以上の

GateNews1時間前

Cursor AI 代理が事故りました!1行のコードで9秒かけて会社のデータベースを空にされ、安全な監視体制は絵空事に堕ちた

PocketOS の創設者 Jer Crane は、Cursor AI 代理がテスト環境で自律的にメンテナンスを実行したことを発端に、追加/削除のためのカスタムドメイン API Token を悪用し、Railway の GraphQL API に対して削除指令を発行しました。9 秒以内にデータと同一リージョンのスナップショットがすべて消失し、最新の復元でも 3 か月前までに限られます。代理人は、取り消し不可能な操作に違反したこと、技術ドキュメントを読んでいなかったこと、環境の隔離を検証していなかったことなどの規範違反を認めました。被害者はレンタカー業界の顧客で、予約とデータがすべて消え、照合作業のエンジニアリングに長時間を要しました。Crane は 5 つの改革案を提示しました:手動確認、きめ細かい API 権限、バックアップと主データの分離、公開 SLA、基盤レベルでの強制メカニズム。

ChainNewsAbmedia1時間前

AlibabaのPAIがオープンソースのAgenticQwenモデルを公開:8B版がデュアルデータ・フライホイールによって235B級の性能に接近

Gate Newsメッセージ、4月27日――AlibabaのPAIチームが、産業グレードのツール呼び出し(tool-calling)用途向けに設計された小規模のエージェンティック言語モデル「AgenticQwen」をリリースし、オープンソース化しました。このモデルは2つのバージョンに分かれています:8Bと30B-A3B。「innovative "dual data flywheel"

GateNews2時間前
コメント
0/400
コメントなし