Foresight News повідомляє, що децентралізована лабораторія штучного інтелекту Gradient випустила фреймворк для розподіленого підкріпленого навчання Echo-2, метою якого є подолання бар’єрів у ефективності тренування AI. Цей фреймворк реалізує розділення Learner та Actor на рівні архітектури, щоб знизити витрати на подальше тренування великих моделей. За даними офіційної інформації, цей фреймворк може зменшити вартість подальшого тренування моделі 30B з 4500 доларів до 425 доларів.
Echo-2 використовує технологію розділення обчислень і пам’яті для асинхронного навчання (Async RL), підтримуючи перенавантаження обчислювальної потужності на нестабільні графічні процесори та гетерогенні графічні процесори на базі Parallax. Цей фреймворк у поєднанні з технологіями обмеженої застарілості, відмовостійкого розподілу задач та власним протоколом зв’язку Lattica підвищує ефективність тренування при збереженні точності моделі.
Крім того, Gradient планує запустити платформу RLaaS (послуга підкріпленого навчання) Logits, яка вже доступна для запису студентів та дослідників.