2025-12-06 15:38:32

Чому зараз всі AI Agent говорять про мультимодальність та виклик інструментів, але на практиці все одно залишаються повільними, дорогими й глючними?

Тому що вузьким місцем інференсу є не «параметри», а пропускна здатність (бендвідс).
Чим більша модель, більше контексту, довший ланцюг інструментів, тим більше все сповільнює саме I/O: завантаження ваг, передача KV cache, обмін проміжними результатами. Обчислювальної потужності достатньо, а от пропускної здатності — ні, і через це інференс завжди лагає.

Inference Labs тут робить не «швидші вузли», а розбиває інференс на малі паралельні блоки, які запускає по всій мережі.

Один сервер більше не обробляє всю модель цілком, вузол відповідає лише за свій фрагмент, а протокол збирає результати докупи.
Інференс переходить від «одноточкового виконання» до «мережевої пропускної здатності».

Це поєднання двох підходів:
– Децентралізований Cloudflare: відповідає за розподіл, оркестрацію, кешування фрагментів інференсу
– Децентралізований AWS Lambda: вузли виконують окремі шматки логіки, результати автоматично збираються
Результат для ончейн агентів:
Швидкість більше не обмежена однією картою, вартість не впирається в окремий сервер, і чим складніший ланцюг викликів — тим більше перевага.

Inference Labs змінює не саму модель, а саме пропускну здатність рівня інференсу.
Це базова проблема, яку мають вирішити всі ончейн агенти, щоб стати швидшими й дешевшими.
@inference_labs @KaitoAI

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

0/400

Немає коментарів

Популярні темиДізнатися більше
#FedRateCutPrediction
948 Популярність
#SUIETFLaunched
222 Популярність
#BitcoinActivityPicksUp
266 Популярність
#PostonSquaretoEarn$50
32.23K Популярність
#DecemberMarketOutlook
83.44K Популярність

Популярні активності Gate FunДізнатися більше

1
DYORDYOR
Рин. кап.:$4.04KХолдери:6
2.40%
2
HY加油何一
Рин. кап.:$3.54KХолдери:1
0.00%
3
GcashGcash
Рин. кап.:$3.81KХолдери:3
1.87%
4
GHOSTGhost
Рин. кап.:$3.59KХолдери:3
0.49%
5
BONDXBONDX
Рин. кап.:$3.58KХолдери:3
0.00%

Закріпити

карта сайту