Foresight News сообщает, что распределенная AI-лаборатория Gradient выпустила Echo-2 — распределенную фреймворк для обучения с усилением, направленный на преодоление барьеров эффективности исследований и тренировки ИИ. Этот фреймворк реализует раздельное управление Learner и Actor на уровне архитектуры, что позволяет снизить затраты на последующую тренировку больших моделей. Согласно официальным данным, этот фреймворк может снизить стоимость последующей тренировки модели 30B с 4500 долларов до 425 долларов.
Echo-2 использует технологию разделения вычислений и памяти для асинхронного обучения (Async RL), поддерживая перенос вычислительных ресурсов для выборки на нестабильные графические карты и на основе гетерогичных графических карт Parallax. В сочетании с технологиями, такими как ограниченная устаревание, отказоустойчивая диспетчеризация задач и собственный протокол связи Lattica, фреймворк повышает эффективность обучения при сохранении точности модели.
Кроме того, Gradient планирует запустить платформу RLaaS (услуга обучения с усилением) Logits, которая уже доступна для предварительной записи студентов и исследователей.