Microsoft открывает исходный код модели Phi-Ground 4B, превосходит OpenAI Operator и Claude по точности кликов по экрану

Борясь с трудностями, Microsoft недавно открыла исходный код семейств модели Phi-Ground, предназначенных для решения проблемы того, где именно ИИ должен кликать по экрану компьютера. Версия на 4 миллиарда параметров в паре с более крупными языковыми моделями для планирования инструкций превзошла по точности кликов OpenAI Operator и Claude Computer Use в бенчмарке Showdown и заняла первое место среди всех моделей с менее чем 100 миллиардами параметров по пяти оценкам, включая ScreenSpot-Pro.

Команда обучалась на более чем 40 миллионов наборах данных и выяснила, что три распространённые техники обучения из научных работ перестали работать эффективно при масштабировании. Ключевой подход оказался простым: выводить координаты как обычные числа, например «523, 417». Ранее исследования предлагали специализированные словари позиций для координат, но они не масштабировались. Также команда обнаружила, что размещение текстовых инструкций перед изображениями повышает качество, поскольку модели могли распознавать цели, обрабатывая пиксели. Кроме того, методы обучения с подкреплением, такие как DPO, улучшали точность даже после дообучения.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Tilde Research обнаруживает, что оптимизатор Muon убивает 25% нейронов; Aurora Alternative обеспечивает прирост эффективности работы с данными в 100 раз

По данным Tilde Research, оптимизатор Muon, который используют ведущие AI-модели, включая DeepSeek V4 и Kimi K2.5, имеет скрытый недостаток: он приводит к тому, что более 25% нейронов в слоях MLP необратимо умирают в ходе раннего обучения. Команда разработала Aurora — альтернативный оптимизатор — и открыла его исходный код. Модель с 1,1 млрд параметров, обученная всего на 100 млрд токенов, показала сопоставимую производительность с Qwen3-1,7B, обученной на 36 трлн токенов, на бенчмарках понимани

GateNews48м назад

Nvidia вкладывает более $40 млрд в ИИ-инвестиции в начале 2026 года, включая $30 млрд на OpenAI

По данным TechCrunch, Nvidia в первые месяцы 2026 года направила более 40 миллиардов долларов на долевые инвестиции в компании, работающие в сфере ИИ, при этом 30 миллиардов долларов — крупнейшее единовременное обязательство — она вложила в OpenAI. Производитель чипов также обязался инвестировать до 3,2 миллиарда долларов в Corning, производителя стекла, и до 2,1 миллиарда долларов в оператора центров обработки данных IREN, что включает пятилетний варрант и отдельный контракт на 3,4 миллиарда до

GateNews4ч назад

NVIDIA открывает долгосрочного партнёра по ИИ Deepinfra — 107 млн долларов серии B для создания «фабрики токенов»

AI компания DeepInfra объявила о завершении раунда B на 1,07 млрд долларов США, который возглавили 500 Global и ранний инженер Google Georges Harik; также в раунде приняли участие стратегические инвесторы, включая NVIDIA (Нвидиа), Samsung Next и Supermicro. Как сообщается в официальной информации, полученные средства будут направлены на расширение мощностей глобальных дата-центров, чтобы решить текущие вычислительные затраты и узкие места по эффективности, возникающие при переходе ИИ-приложений

ChainNewsAbmedia4ч назад

Член управляющего совета ЕЦБ Эсривá 9 мая предупреждает о рисках ИИ для финансовой инфраструктуры

Член Управляющего совета ЕЦБ Эскривá заявил 9 мая, что центральным банкам необходимо пересмотреть устойчивость финансовой инфраструктуры и уровень кибербезопасности с учётом развития искусственного интеллекта. По его словам на мероприятии, недавние достижения в сфере ИИ вынуждают пересмотреть способность финансовых систем противостоять возникающим рискам.

GateNews4ч назад

SpaceX переименовывает xAI в SpaceXAI, подаёт заявку на товарный знак в сфере орбитальных вычислений перед IPO на $1,75 трлн

Согласно поданным на регистрацию товарных знаков в Бюро по патентам и товарным знакам США, компания искусственного интеллекта Илона Маска xAI встраивается в SpaceX под новым брендом SpaceXAI. Переименование охватывает спутниковые центры обработки данных, орбитальные вычисления, облачные вычисления и управление ИИ-нагрузками через платформы в космосе. Маск подтвердил, что xAI прекратит существование как отдельная компания, а продукты на базе ИИ будут работать под SpaceXAI со собственным логотипом

GateNews6ч назад

Появилась экосистема Space Computing от NVIDIA: Space-1 Vera Rubin отправляет мощность ИИ уровня дата-центров в космос

NVIDIA Space Computing 在 GTC 2026 問世,近日輝達官方釋出更多資訊,試圖把加速運算平台從地面資料中心推向太空軌道。這項計畫聚焦於新一代太空任務所需的 AI 基礎設施,讓衛星、軌道平台與地面站都能使用 NVIDIA GPU 與邊緣運算模組,加速處理影像、感測器資料與地理空間情報。 (NVIDIA GTC 2026|輝達送 Space-1 Vera Rubin 上太空,打造真「雲端運算」平台) NVIDIA 表示,隨著商業太空產業發展,未來任務不再只是把資料從太空傳回地球,而是需要在軌道上即時處理、分析與決策。這包括天然災害應變、環境監測、氣候與天氣預測、基礎建設管理,以及自動化太空操作。 從地球到太空:NVIDIA 要解決衛星資料延遲與下行成本 傳統衛星任務往往需要將大量原始資料傳回地面,再由地面資料中心進行分析。但在地球觀測、紅外線影像、SAR 雷達與射頻訊號偵測等應用中,資料量可能高達數百 TB,若完全依賴下行傳輸,不只成本高,也會拉長反應時間。 NVIDIA 的 Space Computing 目標,就是把部分 AI 推理與資料融合能力直接放到太空端

ChainNewsAbmedia12ч назад
комментарий
0/400
Нет комментариев