Керівник великої моделі Xiaomi: коли конкуренція в AI переходить у епоху агентів, самовдосконалення є ключовою подією для AGI

AI自進化

Керівниця команди великомасштабних моделей Xiaomi Ро Фулі 24 квітня на платформі Bilibili провела глибинне інтерв’ю (номер відео: BV1iVoVBgERD). Тривалість інтерв’ю — 3,5 години; це її перше публічне, системне викладення технічних поглядів у ролі технічного керівника. Ро Фулі зазначила, що конкуренція у сфері великомасштабних моделей перейшла від епохи Chat до епохи Agent, а також вказала, що «самоеволюція» стане ключовою подією для AGI впродовж майбутнього року.

Від епохи Chat до епохи Agent: ключові технічні висновки

小米大模型團隊負責人羅福莉訪談

(Джерело: Bilibili)

Згідно з тим, що Ро Фулі заявила в інтерв’ю на Bilibili, вона вказала: у 2026 році фокус конкуренції великомасштабних моделей уже зміститься від якості універсальної розмови до здатності до безперервного автономного виконання складних завдань. Під час інтерв’ю вона сказала, що наразі топові моделі можуть автономно оптимізуватися для конкретних завдань і стабільно виконувати їх протягом 2–3 днів, без потреби в втручанні людини для коригування. В інтерв’ю вона наголосила, що прорив у «здатності до самоеволюції» означає, що AI-системи почали мати можливість самокорекції, і назвала технологічні траєкторії Anthropic та такі технічні змінні, як Claude Opus 4.6, які впливають на всю екосистему AI.

Коригування співвідношення обчислювальних потужностей у Xiaomi та оцінка різниці поколінь Pre-train

Згідно з розкриттям Ро Фулі під час інтерв’ю, у Xiaomi вже здійснили суттєві зміни в стратегії розподілу обчислювальних потужностей. Вона пояснила, що у галузі типовим є співвідношення обчислень Pre-train:Post-train:Inference = 3:5:1, тоді як поточна стратегія Xiaomi відкоригована до 3:1:1 — і в такий спосіб значно стиснуто частку обчислень для подальшого тренування, водночас підвищено інвестиції ресурсів на етапі інференсу.

У своєму інтерв’ю вона пояснила, що цей зсув зумовлений зрілістю стратегії Agent RL Scaling: після тренування більше не потрібно нагромаджувати великі обсяги обчислювальної потужності, а зростання ресурсів на інференсному боці відображає потребу сценаріїв впровадження Agent у можливостях негайної реакції.

Щодо проблеми різниці в поколіннях Pre-train у вітчизняних великомасштабних моделях, Ро Фулі під час інтерв’ю зазначила, що цю різницю вдалося скоротити з минулих 3 років до кількох місяців, а нинішній стратегічний фокус зсувається в бік Agent RL Scaling. Її кар’єрна траєкторія включає Інститут Дамo Алі (Алі Дамо), Quant ілюзію (Huanfang) та DeepSeek (DeepSeek-V2, головний розробник), а у листопаді 2025 року вона приєдналася до Xiaomi.

Технічні специфікації серії MiMo-V2 та відкриті рейтинги

Згідно з оголошенням Xiaomi від 19 березня 2026 року щодо серії MiMo-V2, цього разу одночасно випущено три моделі:

MiMo-V2-Pro: загальна кількість параметрів — десятки; увімкнено параметр 42B, архітектура змішаної уваги, підтримка мільйонного контексту, рівень завершення завдань 81%

MiMo-V2-Omni: сценарії Agent у всіх модальностях

MiMo-V2-TTS: сценарії синтезу мовлення

Згідно з оголошенням, MiMo-V2-Flash, який вже відкрито, у глобальному рейтингу відкритих моделей посів друге місце, а швидкість інференсу досягає 3 разів порівняно з DeepSeek-V3.2.

Поширені запитання

Як Ро Фулі визначає «самоеволюцію» і чому вважає її найключовішою подією для AGI?

Згідно з тим, як Ро Фулі описала під час інтерв’ю на Bilibili 24 квітня 2026 року (BV1iVoVBgERD), у ході інтерв’ю вона зазначила: нині топові моделі вже можуть автономно оптимізуватися для конкретних завдань і стабільно виконувати їх протягом 2–3 днів без втручання людини, а «самоеволюцію» вона кваліфікувала як найключовіше для розвитку AGI впродовж майбутнього року.

Які конкретні коригування зробила Xiaomi у співвідношенні обчислювальних потужностей, і яка логіка за цим стоїть?

Згідно з розкриттям Ро Фулі в інтерв’ю, співвідношення обчислювальних потужностей у Xiaomi змінили з типової для галузі Pre-train:Post-train:Inference = 3:5:1 на 3:1:1, суттєво стиснувши частку обчислень для подальшого тренування; вона пояснила, що це коригування зумовлене зростанням ефективності post-train після того, як стратегія Agent RL Scaling стала зрілою, а також потребою сценаріїв упровадження Agent у здатності до негайного реагування на інференсному боці.

Який відкритий рейтинг та показники швидкості у MiMo-V2-Flash?

Згідно з офіційним оголошенням Xiaomi від 19 березня 2026 року, MiMo-V2-Flash, який уже відкрито, у глобальному рейтингу відкритих моделей посів друге місце; швидкість інференсу — у 3 рази вища за DeepSeek-V3.2, а показник завершення завдань у флагманській версії MiMo-V2-Pro становить 81%.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

AI-фінансова платформа Rogo залучила $160M у Серії D під керівництвом Kleiner Perkins менш ніж за 3 місяці

За даними Beating, AI-платформа Rogo, розроблена для високочастотних фінансових сценаріїв, у квітні 2026 року завершила раунд фінансування Серії D на $160 мільйонів, який очолила Kleiner Perkins за участі Sequoia, Thrive Capital, Khosla Ventures та J.P. Morgan. Залучення коштів відбулося менш ніж через три місяці

GateNews5год тому

Певні CEX запустили Протокол платежів Agent Payments Protocol, що підтримує 4 режими оплати та 9 партнерів, зокрема Ethereum Foundation

Згідно з офіційними джерелами, великий криптовалютний біржовий майданчик запустив Протокол платежів Agent Payments Protocol (APP) — відкритий платіжний стандарт для комерційних транзакцій AI-агентів, 29 квітня. Протокол дає змогу AI-агентам обробляти одиничні платежі, пакетні платежі, платежі за використанням і ескроу-платежі

GateNews5год тому

29 квітня Китай блокує придбання Manus AI, яке підтримує Meta, посилаючись на занепокоєння щодо технологічної та даних безпеки

Згідно з PANews, 29 квітня Управління з огляду інвестиційної безпеки Комісії з національного розвитку та реформ Китаю заборонило іноземне придбання проєкту Manus і вимагало припинити угоду. Manus, якому приписували статус першого в світі агента загального штучного інтелекту, заявив про плани бути придбаним американським технічним гігантом Meta. Угоду заблокували через занепокоєння, пов’язані з міжнародним середовищем, критичними технологіями та безпекою даних. Рішення свідчить, що Китай, як і раніше, відкритий до іноземних інвестицій, але зберігає обережність щодо придбань, що стосуються чутливих секторів, підкреслюючи дотримання регуляторних стандартів.

GateNews5год тому

Основна мережа KITE AI запущена на Avalanche 29 квітня як блокчейн для агентів ШІ, створений за призначенням

Згідно з Altcoin Buzz, основна мережа KITE AI запущена на Avalanche 29 квітня, представляючи спеціалізований блокчейн Layer 1, створений для автономних агентів ШІ. Платформа інтегрує можливості ідентифікації та нативних платежів, щоб агенти ШІ могли працювати, здійснювати транзакції та масштабуватися без тертя. Avalanch

GateNews8год тому

B.AI та deBridge співпрацюють для створення кросчейн-інфраструктури для AI-агентів

Згідно з ChainCatcher, B.AI та deBridge оголосили про стратегічне партнерство 29 квітня для розробки інструментальної кросчейн-інфраструктури, орієнтованої на наміри. Співпраця має на меті забезпечити безперебійну кросчейн-екзекуцію для масштабованої економіки AI Agent. Модель deBridge 0-TVL і технологія кросчейн без комісій за газ

GateNews10год тому

Parallel Парага Агравала залучила $100M Series B для інфраструктури пошуку для AI-агентів

За даними Beating, Parallel Web Systems, заснована колишнім генеральним директором Twitter Парагом Агравалом, завершила раунд Series B на $100 мільйонів доларів під керівництвом Sequoia Capital, оцінивши компанію в $2 мільярдів. Участь також взяли Kleiner Perkins, Index Ventures і Khosla Ventures. Фінансування надійшло через шість місяців після того, як компанія залучила мільйонів у раунді Series A за оцінкою мільйонів, майже утричі збільшивши свою вартість.

GateNews10год тому
Прокоментувати
0/400
Немає коментарів