NVIDIA представила Nemotron 3 Nano Omni з відкритим кодом мультимодальну

Згідно з оголошенням NVIDIA у офіційному блозі від 28 квітня (автор Kari Briski), NVIDIA представила Nemotron 3 Nano Omni — відкриту багатомодальну модель, яка об’єднує візуальні, аудіо та мовні можливості в одній моделі, з метою надати для систем AI agent нижчу затримку та меншу вартість “рівня сприйняття”.

Ключові специфікації: 30B-A3B MoE、256K контекст、9 разів пропускна здатність、здобула 6 місць №1 у рейтингах

Ключова архітектура:

30B-A3B hybrid mixture-of-experts (загальні параметри 30B, активні 3B)

Інтеграція Conv3D та EVS кодування

Довжина 256K контексту

Вхід: текст, зображення, аудіо, відео, документи, діаграми, GUI-екрани

Вихід: текст

Сигнали продуктивності: у порівнянні з іншими відкритими omni-моделями за однакової інтерактивності забезпечує 9 разів пропускну здатність; у трьох категоріях — інтелектуальні документи, розуміння відео, розуміння аудіо — здобула перше місце в усіх 6 базових рейтингах (в оголошенні NVIDIA не наведено конкретних балів; воно спрямовує читачів до розробницького блогу, щоб переглянути детальні дані).

NVIDIA позиціонує Nemotron 3 Nano Omni як “очі та вуха” в агентних системах; вона може виконувати розподіл робіт разом із моделями того ж сімейства, такими як Nemotron 3 Super (високочастотне виконання) та Nemotron 3 Ultra (складне планування), а також може взаємодіяти з хмарними моделями сторонніх розробників. Три типові сценарії використання агентів:

Агент для комп’ютерного використання (Computer Use Agent): власне візуальне міркування з роздільною здатністю 1920×1080

Інтелект документів: міркування з вхідними даними, що охоплюють діаграми/таблиці/скріншоти та змішені медіа

Розуміння аудіо/відео: об’єднання мовлення, зображення й записів в один ланцюжок міркування

Склад компаній, що приєдналися: Hon Hai, Palantir — у списку, H Company CEO — з іменним підтвердженням

У оголошенні NVIDIA чітко розмежовано “виробниче впровадження” та “перебуває на оцінюванні”:

Вже виробничо впроваджено: Aible, Applied Scientific Intelligence (ASI), Eka Care, Hon Hai (Foxconn), H Company, Palantir, Pyler

Перебуває на оцінюванні: Amdocs, Dell, Docusign, Infosys, IQVIA, Lila, Oracle, Quantiphi, TCS, Zefr тощо

CEO H Company Gautier Cloix у оголошенні з іменним підтвердженням сказав: «To build useful agents, you can’t wait seconds for a model to interpret a screen. By building on Nemotron 3 Nano Omni, our agents can rapidly interpret full HD screen recordings — something that wasn’t practical before.» Переклад: «Щоб створювати корисні агенти, не можна чекати секунди, поки модель інтерпретує екран. Спираючись на Nemotron 3 Nano Omni, наші агенти можуть швидко інтерпретувати повні HD-записи екрана — те, що раніше було не практично здійсненним.»

Стратегія відкритого коду та розгортання: weights / datasets / методи навчання — повністю відкриті

Під час випуску NVIDIA оприлюднила одночасно:

вагові коефіцієнти моделі

навчальні набори даних

техніки/методології навчання

Конвеєр розгортання охоплює три рівні:

Локальні робочі станції: NVIDIA DGX Spark, DGX Station

NIM мікросервіси: build.nvidia.com

Платформи сторонніх розробників: Hugging Face, OpenRouter, а також через 25+ NVIDIA Cloud Partners, платформи для інференсу та постачальників хмарних сервісів

Індивідуальні інструменти використовують NVIDIA NeMo. За минулий рік сімейство Nemotron 3 (Nano/Super/Ultra) на Hugging Face накопичило понад 50,000,000 завантажень; цього разу Omni поширює можливості цього сімейства на багатомодальність та агентну сферу.

Ця стаття NVIDIA, в якій висвітлено відкриття коду Nemotron 3 Nano Omni як багатомодальної моделі, вперше з’являється на 鏈新聞 ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

AI-фінансова платформа Rogo залучила $160M у Серії D під керівництвом Kleiner Perkins менш ніж за 3 місяці

За даними Beating, AI-платформа Rogo, розроблена для високочастотних фінансових сценаріїв, у квітні 2026 року завершила раунд фінансування Серії D на $160 мільйонів, який очолила Kleiner Perkins за участі Sequoia, Thrive Capital, Khosla Ventures та J.P. Morgan. Залучення коштів відбулося менш ніж через три місяці

GateNews6год тому

Певні CEX запустили Протокол платежів Agent Payments Protocol, що підтримує 4 режими оплати та 9 партнерів, зокрема Ethereum Foundation

Згідно з офіційними джерелами, великий криптовалютний біржовий майданчик запустив Протокол платежів Agent Payments Protocol (APP) — відкритий платіжний стандарт для комерційних транзакцій AI-агентів, 29 квітня. Протокол дає змогу AI-агентам обробляти одиничні платежі, пакетні платежі, платежі за використанням і ескроу-платежі

GateNews6год тому

29 квітня Китай блокує придбання Manus AI, яке підтримує Meta, посилаючись на занепокоєння щодо технологічної та даних безпеки

Згідно з PANews, 29 квітня Управління з огляду інвестиційної безпеки Комісії з національного розвитку та реформ Китаю заборонило іноземне придбання проєкту Manus і вимагало припинити угоду. Manus, якому приписували статус першого в світі агента загального штучного інтелекту, заявив про плани бути придбаним американським технічним гігантом Meta. Угоду заблокували через занепокоєння, пов’язані з міжнародним середовищем, критичними технологіями та безпекою даних. Рішення свідчить, що Китай, як і раніше, відкритий до іноземних інвестицій, але зберігає обережність щодо придбань, що стосуються чутливих секторів, підкреслюючи дотримання регуляторних стандартів.

GateNews6год тому

Основна мережа KITE AI запущена на Avalanche 29 квітня як блокчейн для агентів ШІ, створений за призначенням

Згідно з Altcoin Buzz, основна мережа KITE AI запущена на Avalanche 29 квітня, представляючи спеціалізований блокчейн Layer 1, створений для автономних агентів ШІ. Платформа інтегрує можливості ідентифікації та нативних платежів, щоб агенти ШІ могли працювати, здійснювати транзакції та масштабуватися без тертя. Avalanch

GateNews9год тому

B.AI та deBridge співпрацюють для створення кросчейн-інфраструктури для AI-агентів

Згідно з ChainCatcher, B.AI та deBridge оголосили про стратегічне партнерство 29 квітня для розробки інструментальної кросчейн-інфраструктури, орієнтованої на наміри. Співпраця має на меті забезпечити безперебійну кросчейн-екзекуцію для масштабованої економіки AI Agent. Модель deBridge 0-TVL і технологія кросчейн без комісій за газ

GateNews11год тому

Parallel Парага Агравала залучила $100M Series B для інфраструктури пошуку для AI-агентів

За даними Beating, Parallel Web Systems, заснована колишнім генеральним директором Twitter Парагом Агравалом, завершила раунд Series B на $100 мільйонів доларів під керівництвом Sequoia Capital, оцінивши компанію в $2 мільярдів. Участь також взяли Kleiner Perkins, Index Ventures і Khosla Ventures. Фінансування надійшло через шість місяців після того, як компанія залучила мільйонів у раунді Series A за оцінкою мільйонів, майже утричі збільшивши свою вартість.

GateNews11год тому
Прокоментувати
0/400
Немає коментарів