Foresight News melaporkan bahwa Laboratorium AI Terdistribusi Gradient merilis kerangka kerja pembelajaran penguatan terdistribusi Echo-2, yang bertujuan untuk mengatasi hambatan efisiensi pelatihan penelitian AI. Kerangka kerja ini mengimplementasikan pemisahan antara Learner dan Actor di tingkat arsitektur, bertujuan untuk menurunkan biaya pelatihan ulang model besar. Menurut data resmi, kerangka kerja ini dapat menurunkan biaya pelatihan ulang model 30B dari 4500 dolar menjadi 425 dolar.
Echo-2 menggunakan teknologi pemisahan penyimpanan dan komputasi untuk pelatihan asinkron (Async RL), mendukung pemindahan daya sampling ke instance GPU tidak stabil dan GPU heterogen berbasis Parallax. Kerangka kerja ini dilengkapi dengan teknologi seperti ketertinggalan terbatas, penjadwalan toleransi kesalahan, dan protokol komunikasi Lattica buatan sendiri, yang meningkatkan efisiensi pelatihan sambil mempertahankan akurasi model.
Selain itu, Gradient berencana meluncurkan platform RLaaS (Reinforcement Learning as a Service) Logits, yang saat ini telah dibuka untuk reservasi bagi pelajar dan peneliti.