アリババのQwenがQwen-Scopeの解釈可能性モジュールをオープンソース化、4月30日に7モデルをカバー

PANewsによると、4月30日にアリババのQwenは、Qwen3およびQwen3.5シリーズモデルで学習された解釈可能性モジュール「Qwen-Scope」のオープンソース化を発表した。リリースでは、密なバリアントとモデリング・オブ・エキスパーツ(Mixture-of-Experts)バリアントにまたがる7つの大規模言語モデルと、スパース・オートエンコーダーの重みが14セット含まれている。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Anthropic Claude Code は請求バグによりユーザーに200.98ドルを過剰請求し、当初は返金を拒否したが最終的には全額補償されることになった

Beatingによる監視では、AnthropicのClaude Codeサービスにおける請求の不具合により、最大20倍の加入者が追加の利用料金として200.98ドルを過剰請求されていたことが判明した。同加入者は月間クォータの13%しか使用していなかった。ユーザーのgitリポジトリのコミット履歴に大文字の

GateNews1分前

DeepSeekは4月30日にマルチモーダル推論を強化するために視覚プリミティブ方式を導入

DeepSeekの技術レポートによると、4月30日、同社はVisual Primitives(ビジュアル・プリミティブ)を導入しました。これは、マルチモーダル課題におけるReference Gap問題に対処するために、点やバウンディングボックスなどの基本的な視覚要素を推論チェーンに埋め込む手法です。この方法は画像トークンの消費を削減します

GateNews26分前

NVIDIA、フラッグシップモデル「Cosmos-Reason2-32B」の重みを提供開始し、コンテキストウィンドウを256Kトークンに拡張

Beatingによると、NVIDIAは物理AI推論のビジョン-言語モデル(VLM)であるCosmos-Reason2-32Bの重みをリリースした。これは、ロボットや自動運転システムが空間的・時間的・物理的な原理を理解するのを助けることを目的とした同社の旗艦モデルだ。320億パラメータのモデル、

GateNews29分前

OpenAI が Codex をなぜ「ゴブリン」という禁句で扱うのかを暴く:オタク人格の報酬が制御不能に

OpenAIは公式ブログで、Codexが禁談哥布林などの生物について説明しているのは、書き手タイプの人格訓練における報酬シグナルが生物の比喩を好むことで、人格をまたいだ汚染やRLHFの誤導が起きたためだと説明している。Barron Rothがシステム指令を暴露した後、OpenAIは短期のハードコードと長期の報酬シグナルの除去という2つの戦略を採用し、報酬設計の脆弱性を警告した。追加の後訓練に向けた監査は、より精密であるべきだ。

ChainNewsAbmedia1時間前

Nvidia B300 AIサーバー、供給逼迫の中で中国で100万ドルに到達

ロイターによると、米グローバル通信社は、NvidiaのB300 AIサーバーが中国で現在、約700万人民元(100万米ドル)で販売されている。密輸ネットワークへの取り締まり強化と、地元のテック企業による需要の継続が背景だ。この価格は、2025年後半の約400万人民元(585,000米ドル)から急騰しており、著しく

GateNews2時間前

LG CNSの営業利益はAIとクラウドの成長により第1四半期に19%増加

조선일보에 따르면 LG CNS는 4월 30일에 올해 1분기 영업이익이 전년 동기 대비 19.4% 증가한 942억 원(미화 6,410만 달러)이라고 밝혔다. AI와 클라우드 수요에 힘입은 결과다. 매출은 8.6% 증가해 1.3조 원(미화 8억 9,400만 달러)이었다. 회사의 AI 및 클라우드 부문은 765.4 billi

GateNews3時間前
コメント
0/400
コメントなし