Сообщение Gate News, 24 апреля — руководитель команды большой языковой модели Xiaomi Луо Фули в подробном интервью раскрыла, что модель MiMo-V2-Pro в сумме имеет 1 триллион параметров и для обучения потребовала тысячи GPU. Она отметила, что масштаб 1T представляет собой минимальный порог для достижения производительности, приближающейся к уровню Claude Opus 4.6, и получения конкурентного входного билета на следующий этап ИИ-агентов.
Технически версия Pro использует механизм экстремально разреженного внимания с соотношением 7:1 между глобальным вниманием и вниманием в скользящем окне, чтобы контролировать затраты на инференс при обработке длинного контекста. Модель также сохраняет архитектуру MTP (Multi-Token Prediction), чтобы задействовать избыточную вычислительную мощность для более быстрого инференса.
Со стороны управления команда MiMo численностью 100 человек имеет лишь 30–40 сотрудников, непосредственно вовлеченных в ключевые итерации. Команда работает без формальных иерархий или явных делений на подгруппы и без фиксированных дедлайнов поставки. При столкновении с нестабильными численными проблемами, такими как всплески training loss, команда в первую очередь приостанавливает обучение для расследования, даже если это означает остановку работы на одну-две недели и понесение затрат в миллионы долларов на вычисления.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Google планирует инвестировать до $40 Billion в Anthropic, обещает 5+ гигаватт вычислительных мощностей
Сообщение Gate News, 24 апреля — Согласно рыночным источникам, Google планирует инвестировать в Anthropic до $40 миллиарда. Инвестиции начнутся с первоначальных $10 миллиарда наличными, а затем последуют до дополнительных $30 миллиарда в зависимости от достижения указанных вех.
Google также предоставит Anthropic не менее 5 гигаватт вычислительных мощностей в рамках партнерства.
GateNews50м назад
Швейцарский регулятор FINMA предупреждает, что инструмент ИИ Anthropic Mythos несет финансовые риски
Сообщение Gate News, 24 апреля — Финансовый надзорный орган Швейцарии (FINMA) заявил, что разрешение банкам быстро и удобно внедрять инструмент искусственного интеллекта Mythos от Anthropic будет создавать серьезные риски для
GateNews1ч назад
DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости
Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode
GateNews2ч назад
Fere AI завершает раунд финансирования на $1,3 млн под руководством Ethereal Ventures
Сообщение Gate News, 24 апреля — Fere AI, платформа для торговых агентов цифровыми активами с применением ИИ, объявила о завершении раунда финансирования на $1,3 млн, который возглавила Ethereal Ventures; в нем также участвовали Galaxy Vision Hill и Kosmos Ventures.
Платформа поддерживает кроссчейн-сети, включая Ethereum,
GateNews2ч назад
Anthropic откатывает изменения Claude Code после снижения качества; все исправления завершены
Сообщение Gate News от 24 апреля — Anthropic признала недавнее снижение качества Claude Code и подтвердила, что все связанные проблемы были устранены с помощью откатов и исправлений. Проблемы возникли из-за трех изменений продукта и подсказок, внесенных в период между началом и серединой апреля.
4 марта,
GateNews3ч назад
Сооснователь NeoSoul Каэлан: Индустрия ИИ должна позволять существовать игрушкам; инновации часто начинаются с экспериментальных продуктов
Сообщение Gate News, 24 апреля — На недавнем форуме в Гонконге по интеллектуальным зашифрованным финансам сооснователь NeoSoul Каэлан поделился соображениями о том, как оценивать проекты в области ИИ на ранней стадии в быстро развивающейся индустрии ИИ. Помимо оценки текущих продуктов, команды должны продемонстрировать способность идти в ногу с возможностями базовой модели, заявил он.
GateNews4ч назад