No domínio do desenvolvimento de modelos de IA, o treino de grandes modelos de linguagem exigia tradicionalmente hardware dispendioso e recursos em nuvem, concentrando a tecnologia em poucas instituições de grande dimensão.
(Fonte: Tether)
O lançamento recente do QVAC Fabric pela Tether introduz uma nova framework de afinação LoRA, desenvolvida especificamente para o BitNet (um grande modelo de linguagem de 1 bit). Esta inovação reduz de forma significativa as exigências em termos de computação e memória, permitindo que utilizadores comuns possam participar no treino de modelos de IA.
Uma das principais vantagens do QVAC Fabric é a sua compatibilidade alargada com hardware. A framework funciona numa grande variedade de dispositivos, incluindo:
Portáteis
GPUs de consumo (Intel, AMD, Apple Silicon)
Smartphones (incluindo várias GPUs móveis)
Isto significa que os modelos de IA deixam de estar restritos a centros de dados ou hardware especializado, podendo agora ser treinados e executados diretamente em dispositivos do quotidiano.
Uma funcionalidade de destaque desta tecnologia é a possibilidade de afinar modelos em dispositivos móveis.
Por exemplo:
Num Samsung S25 (GPU Adreno), um modelo com 125 milhões de parâmetros pode ser afinado em cerca de 10 minutos
No mesmo dispositivo, um modelo com 1 mil milhão de parâmetros demora cerca de 1 hora e 18 minutos
Num iPhone 16, um modelo com 1 mil milhão de parâmetros requer aproximadamente 1 hora e 45 minutos
A equipa conseguiu mesmo executar modelos com até 13 mil milhões de parâmetros num smartphone, evidenciando as crescentes capacidades de IA do hardware móvel.
Face aos modelos convencionais, a arquitetura BitNet revela vantagens claras em termos de desempenho e eficiência de recursos:
As velocidades de inferência em GPU móvel são entre 2 e 11 vezes superiores às do CPU
Capaz de lidar com cargas de trabalho que antes exigiam centros de dados
Reduz a utilização de VRAM até cerca de 77,8% em comparação com modelos de 16 bits
Oferece maior capacidade operacional, suportando modelos de maior dimensão e aplicações personalizadas
Estas melhorias tornam muito mais simples a implementação de aplicações de IA em dispositivos periféricos.
O treino tradicional de IA dependia fortemente de hardware NVIDIA e de serviços em nuvem. O QVAC Fabric elimina essa dependência ao permitir a afinação LoRA de LLM de 1 bit em hardware não-NVIDIA—including AMD, Intel, Apple Silicon e GPUs móveis como Adreno e Mali. Esta alteração reduz custos e fomenta um desenvolvimento de IA mais descentralizado.
Outra vantagem central do QVAC Fabric é o apoio à privacidade dos dados e ao treino distribuído:
O treino do modelo pode ser realizado localmente, dispensando o envio de dados sensíveis
Facilita o treino federado
Reduz a dependência de infraestruturas centralizadas
Estas funcionalidades apontam para um futuro ecossistema de IA mais seguro e escalável.
Paolo Ardoino destaca que a IA terá um papel determinante na sociedade do futuro e que o seu desenvolvimento não deve ser monopolizado por um pequeno grupo de detentores de recursos. Sublinha que a dependência excessiva de arquiteturas centralizadas para o treino de IA não só trava a inovação como ameaça a estabilidade global do ecossistema. Permitir que a IA funcione em dispositivos pessoais é, por isso, um passo fundamental para uma adoção mais generalizada.
O QVAC Fabric da Tether representa não só uma inovação tecnológica, mas também uma potencial transformação dos modelos de desenvolvimento de IA. Ao reduzir as barreiras de hardware e reforçar as capacidades multiplataforma, os grandes modelos de linguagem estão a sair progressivamente dos centros de dados para integrar dispositivos do dia a dia. Com a evolução destas tecnologias, a IA prepara-se para passar de recursos centralizados para um futuro mais aberto, descentralizado e amplamente acessível.





