Сообщение Gate News, 24 апреля — руководитель команды большой языковой модели Xiaomi Луо Фули в подробном интервью раскрыла, что модель MiMo-V2-Pro в сумме имеет 1 триллион параметров и для обучения потребовала тысячи GPU. Она отметила, что масштаб 1T представляет собой минимальный порог для достижения производительности, приближающейся к уровню Claude Opus 4.6, и получения конкурентного входного билета на следующий этап ИИ-агентов.

Технически версия Pro использует механизм экстремально разреженного внимания с соотношением 7:1 между глобальным вниманием и вниманием в скользящем окне, чтобы контролировать затраты на инференс при обработке длинного контекста. Модель также сохраняет архитектуру MTP (Multi-Token Prediction), чтобы задействовать избыточную вычислительную мощность для более быстрого инференса.

Со стороны управления команда MiMo численностью 100 человек имеет лишь 30–40 сотрудников, непосредственно вовлеченных в ключевые итерации. Команда работает без формальных иерархий или явных делений на подгруппы и без фиксированных дедлайнов поставки. При столкновении с нестабильными численными проблемами, такими как всплески training loss, команда в первую очередь приостанавливает обучение для расследования, даже если это означает остановку работы на одну-две недели и понесение затрат в миллионы долларов на вычисления.

Посмотреть источник

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Google планирует инвестировать до $40 Billion в Anthropic, обещает 5+ гигаватт вычислительных мощностей

Новости индустрии ИИ

Сообщение Gate News, 24 апреля — Согласно рыночным источникам, Google планирует инвестировать в Anthropic до $40 миллиарда. Инвестиции начнутся с первоначальных $10 миллиарда наличными, а затем последуют до дополнительных $30 миллиарда в зависимости от достижения указанных вех. Google также предоставит Anthropic не менее 5 гигаватт вычислительных мощностей в рамках партнерства.

GateNews50м назад

Швейцарский регулятор FINMA предупреждает, что инструмент ИИ Anthropic Mythos несет финансовые риски

Новости индустрии ИИ

Сообщение Gate News, 24 апреля — Финансовый надзорный орган Швейцарии (FINMA) заявил, что разрешение банкам быстро и удобно внедрять инструмент искусственного интеллекта Mythos от Anthropic будет создавать серьезные риски для

GateNews1ч назад

DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости

Новости индустрии ИИ

Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode

GateNews2ч назад

Fere AI завершает раунд финансирования на $1,3 млн под руководством Ethereal Ventures

ИИ-агент Новости индустрии ИИ

Сообщение Gate News, 24 апреля — Fere AI, платформа для торговых агентов цифровыми активами с применением ИИ, объявила о завершении раунда финансирования на $1,3 млн, который возглавила Ethereal Ventures; в нем также участвовали Galaxy Vision Hill и Kosmos Ventures. Платформа поддерживает кроссчейн-сети, включая Ethereum,

GateNews2ч назад

Anthropic откатывает изменения Claude Code после снижения качества; все исправления завершены

Новости индустрии ИИ

Сообщение Gate News от 24 апреля — Anthropic признала недавнее снижение качества Claude Code и подтвердила, что все связанные проблемы были устранены с помощью откатов и исправлений. Проблемы возникли из-за трех изменений продукта и подсказок, внесенных в период между началом и серединой апреля. 4 марта,

GateNews3ч назад

Сооснователь NeoSoul Каэлан: Индустрия ИИ должна позволять существовать игрушкам; инновации часто начинаются с экспериментальных продуктов

Новости индустрии ИИ

Сообщение Gate News, 24 апреля — На недавнем форуме в Гонконге по интеллектуальным зашифрованным финансам сооснователь NeoSoul Каэлан поделился соображениями о том, как оценивать проекты в области ИИ на ранней стадии в быстро развивающейся индустрии ИИ. Помимо оценки текущих продуктов, команды должны продемонстрировать способность идти в ногу с возможностями базовой модели, заявил он.

GateNews4ч назад

комментарий

0/400

Нет комментариев