2025-12-06 15:38:32

Почему сейчас все AI-агенты говорят о мультимодальности и вызове инструментов, но на практике всё равно работают медленно, дорого и с перебоями?

Потому что узким местом в инференсе на самом деле являются не «параметры», а пропускная способность (bandwidth).
Чем больше модель, чем больше контекста, чем длиннее цепочка инструментов — тем больше тормозит I/O: загрузка весов, передача KV-кеша, перемещение промежуточных результатов туда-сюда. Мощности хватает, а пропускной способности — нет, и инференс всегда будет тормозить.

Inference Labs делает не «более быстрые ноды», а переосмысливает инференс: разбивает его на параллелизируемые маленькие куски и распределяет выполнение по всей сети.

Одна машина больше не тянет всю модель: ноды отвечают только за фрагменты, а протокол собирает результаты обратно.
Инференс превращается из «исполнения в одной точке» в «сетевой throughput».

По форме это похоже на сочетание двух вещей:
– Децентрализованный Cloudflare: отвечает за распределение, оркестрацию и кеширование фрагментов инференса
– Децентрализованный AWS Lambda: ноды исполняют небольшие логические участки, результаты автоматически агрегируются
Для ончейн-агентов это означает:
Скорость больше не ограничена одной картой, стоимость не прижимается одной машиной, а чем сложнее цепочка вызовов — тем заметнее преимущества.

Inference Labs меняет не модель, а пропускной слой инференса.
Это базовая проблема, которую не обойти всем, кто хочет запускать ончейн-агентов быстро и дешево.
@inference_labs @KaitoAI

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

0/400

Нет комментариев

Популярные темыПодробнее
#JoinCreatorCertificationProgramToEarn$10,000
108.59K Популярность
#FedRateCutPrediction
27.28K Популярность
#SUIETFLaunched
9.48K Популярность
#BitcoinActivityPicksUp
7.52K Популярность
#PostonSquaretoEarn$50
37.9K Популярность

Горячее на Gate FunПодробнее

1
JOHNJohncoin
РК:$3.77KДержатели:4
0.48%
2
CASHCASH
РК:$3.7KДержатели:2
1.28%
3
GAUSDTGATE
РК:$3.57KДержатели:2
0.05%
4
GtigerGtiger
РК:$3.64KДержатели:5
0.36%
5
一群狗毛没实力就别发币一群狗毛没实力就别发币
РК:$3.54KДержатели:1
0.00%

Закрепить

Карта сайта