ニュース速報メッセージ:4月23日 — Perplexityの研究チームが、Web検索エージェント向けのポストトレーニング手法の詳細を説明する技術記事を公開しました。このアプローチは、2つのオープンソースのQwen3.5モデル (Qwen3.5-122B-A10B と Qwen3.5-397B-A17B) を使用し、2段階のパイプラインを採用します。すなわち、命令追従と言語の一貫性を確立するための教師あり微調整 (SFT) の後に、検索精度とツール使用の効率を最適化するためのオンライン強化学習 (RL) を行います。
RLフェーズでは、GRPOアルゴリズムを2つのデータソースとともに活用します。1つは、内部のシードクエリから構築された独自のマルチホップ検証可能な質問-回答データセットで、推論の2〜4ホップと、複数ソルバによる検証を必要とします。もう1つは、配備要件を客観的に検査可能な原子的条件へ変換してSFTの振る舞い劣化を防ぐ、ルーブリックに基づく汎用会話データです。
報酬設計では、ゲート付き集約を採用します——ベースラインの正しさが達成された場合にのみ、選好スコアが寄与します (question-answer match または すべてのルーブリック基準が満たされた場合)。これにより、高い選好信号が事実誤りを覆い隠すことを防ぎます。効率ペナルティは同一グループ内のアンカーリングを用い、同じグループにおける正答のベースラインを超えて、ツール呼び出しや生成長に対してなめらかなペナルティを適用します。
評価では、Qwen3.5-397B-SFT-RLが検索ベンチマーク全体で業界最高水準の性能を達成しています。FRAMESでは、単一ツール呼び出しで57.3%の精度を実現し、GPT-5.4を5.7パーセントポイント上回ります。また、Claude Sonnet 4.6を4.7パーセントポイント上回ります。中程度の予算 (4回のツール呼び出し) では、1クエリあたり$0.02で73.9%の精度を達成し、GPT-5.4の1クエリあたり$0.085での67.8%の精度、Sonnet 4.6の1クエリあたり$0.153での62.4%の精度と比較しています。コスト数値は各提供元の公開API料金に基づき、キャッシュの最適化は除外されています。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
預言者は本日、1万ドルのライブ取引トランシェを備えたAI搭載予測市場を開始
MetaversePostによると、Prophetは本日(5月6日)AI搭載の予測市場を立ち上げ、ライブ取引に割り当てられたUSDCとして$10,000を用意した。ユーザーは、各市場の確率ベースの価格を生成するAIのカウンターパーティーに対して直接取引でき、一部の契約は24時間以内に決済される
GateNews5時間前
Tessera Labsはa16zが主導したシリーズAを締結。6人のAIチームが60人のSAPコンサルタントに取って代わる
Beatingによると、AIシステム統合企業のTessera Labsは、a16zが主導したシリーズAの資金調達を完了した。同社は2024年に設立され、マルチエージェントのプラットフォームを用いて、従来3〜5年と1億ドル〜5億ドルを要していたSAP ECCからS/4HANAへの移行を自動化している。
GateNews5時間前
日経先物は4万ポイントを維持しながら堅調で、米国株も史上最高値を更新したが、AI産業はまだ初期段階に入ったばかりなのだろうか?
ゴールドマン・サックスは、消費型エージェントのワークロードによってAI需要がトークン消費を大幅に押し上げ、2030年までに成長が12倍を超える可能性があり、月間のトークン演算は60兆に達し得ると指摘した。エージェントではないものとコンシューマー・エージェントの違いは、長時間にわたって自動化タスクを行う点にあり、もしそれが本当ならAIはエージェンティックな業務プロセスに入っていく。ラリー・フィンクは、計算能力の供給が深刻に不足しており、将来的に計算能力の先物が登場する可能性があると述べた。両者はともに、AI基盤整備を支える強気論の根拠となっている。この記事では、AIはまだ初期段階にあると考えられている。
ChainNewsAbmedia6時間前
WLFIの生態系AIプロジェクトであるWorldClawが代理業務システムを提供、未公開のブランドでも1万ドルで売れるのか?
トランプ一家の暗号プロジェクト World Liberty Financial(WLFI)が新たな打ち手を打ち、WorldClaw と提携して AI モデルの統一入口となる WorldRouter を提供。300 件の AI モデルを統合するエージェント向けプラットフォームを売りにし、最高の有料プランは約1万ドル近い値段だが、おまけとして付いてくるのは「ブランド名と作業用OSが明かされていない」ハードウェア機器で、外部の懸念を呼んでいる。
@WorldClawAI は AI へのアクセスを拡大しており、$WLFI はそのエコシステムにおいて重要な役割を担っています。ユーザーは WorldRouter で 300+ のモデルにアクセスでき、エージェントは
ChainNewsAbmedia9時間前
Meta は AI アシスタント Hatch を開発し、OpenClaw を対標として 6 月末までに社内テストを完了する
『フィナンシャル・タイムズ』が5月5日に報じたところによると、Metaは一般消費者向けのAIアシスタント(Hatch)を開発しているという。これはOpenAI傘下のOpenClawに着想を得たもので、6月末までに社内テストを完了することを目指している。Metaは同時に、今年の第4四半期までに、独立した代理型の買い物ツールを自社のInstagramサービスに統合する計画だ。
MarketWhisper10時間前
Cloudflare:非人間のトラフィックがすでに多数派に、x402 財団のアドレスがウェブ経済を左右
Cloudflareのチーフ・ストラテジー・オフィサーは、現在インターネット通信の半分以上が非人間によるものであると述べ、AIエージェントによって引き起こされるWeb利用パターンの変化を強調した。同社は、持続可能なデジタル・コンテンツ経済を支えるインフラを構築する主要な取り組みとして、x402 Foundationを挙げている。
CryptoFrontier11時間前