У розробці моделей ШІ навчання великих мовних моделей зазвичай вимагало дорогий апаратний комплекс і хмарні ресурси, що зосереджувало технологію у руках кількох провідних інституцій.
(Джерело: Tether)
QVAC Fabric, нещодавно презентований Tether, впроваджує новий LoRA-фреймворк для тонкого налаштування, розроблений спеціально для BitNet (1-бітної великої мовної моделі). Це досягнення суттєво знижує вимоги до обчислювальних потужностей і пам’яті, дозволяючи звичайним користувачам брати участь у навчанні моделей ШІ.
Важливою перевагою QVAC Fabric є широка апаратна сумісність. Фреймворк працює на різноманітних пристроях, зокрема:
Ноутбуках
Графічних процесорах споживчого рівня (Intel, AMD, Apple Silicon)
Смартфонах (включаючи різні мобільні GPU)
Це означає, що моделі ШІ більше не обмежені дата-центрами чи спеціалізованим обладнанням — їх можна навчати і запускати безпосередньо на повсякденних пристроях.
Однією з ключових функцій цієї технології є можливість тонкого налаштування моделей на мобільних пристроях.
Наприклад:
На Samsung S25 (Adreno GPU) модель із 125 млн параметрів можна тонко налаштувати приблизно за 10 хвилин
На цьому ж пристрої модель із 1 млрд параметрів потребує близько 1 години 18 хвилин
На iPhone 16 модель із 1 млрд параметрів потребує приблизно 1 годину 45 хвилин
Команда також змогла запустити моделі до 13 млрд параметрів на смартфоні, що демонструє стрімке зростання можливостей мобільного апаратного забезпечення для ШІ.
Архітектура BitNet у порівнянні з традиційними моделями показує явні переваги у продуктивності та ефективності використання ресурсів:
Швидкість інференсу на мобільних GPU у 2–11 разів вища, ніж на CPU
Може обробляти навантаження, які раніше вимагали дата-центрів
Зменшує використання VRAM до приблизно 77,8% порівняно з 16-бітними моделями
Забезпечує більшу функціональність, підтримуючи більші моделі та персоналізовані застосування
Ці покращення значно спрощують розгортання ШІ-застосунків на пристроях на периферії мережі.
Традиційне навчання ШІ значною мірою залежало від обладнання NVIDIA та хмарних сервісів. QVAC Fabric долає цю залежність, дозволяючи тонке налаштування 1-бітних LLM LoRA на обладнанні, відмінному від NVIDIA — включаючи AMD, Intel, Apple Silicon та мобільні GPU, такі як Adreno і Mali. Такий підхід не лише знижує витрати, а й сприяє більш децентралізованому розвитку ШІ.
QVAC Fabric також підтримує захист даних і розподілене навчання:
Навчання моделей можна виконувати локально, без необхідності завантажувати конфіденційні дані
Сприяє федеративному навчанню
Зменшує залежність від централізованої інфраструктури
Ці функції відкривають безпечніший і масштабований шлях для майбутньої екосистеми ШІ.
Паоло Ардоіно наголошує, що ШІ відіграватиме ключову роль у майбутньому суспільства, і його розвиток не повинен бути монополізований невеликою групою власників ресурсів. Він підкреслює, що надмірна залежність від централізованих архітектур для навчання ШІ не лише стримує інновації, а й загрожує стабільності екосистеми. Надання можливості працювати ШІ на персональних пристроях є важливим кроком до ширшого впровадження.
QVAC Fabric від Tether — це не лише технологічне нововведення, а й потенційна трансформація моделей розвитку ШІ. Зниження апаратних бар’єрів і посилення кросплатформних можливостей поступово виводять великі мовні моделі за межі дата-центрів і наближають їх до повсякденних пристроїв. Із розвитком цих технологій ШІ переходить від централізованих ресурсів до більш відкритого, децентралізованого та доступного майбутнього.





