Gate News informa que, a 18 de março, a Nvidia está a preparar-se para lançar no mercado chinês o chip de inferência Groq 3 LPU, com previsão de chegar ao mercado já em maio. Segundo fontes próximas, este chip não é uma versão reduzida nem foi especialmente desenvolvido para o mercado chinês. Esta é a primeira vez que a Nvidia, após adquirir a empresa de chips de inferência AI Groq por cerca de 17 bilhões de dólares no final de 2025, introduz a sua linha de produtos na China, distinguindo-se da estratégia de chips independentes para a China, como a GPU H200, que já recebeu autorização para retomar a produção. O Groq 3 LPU é um coprocessador dedicado à inferência, equipado com 500MB de SRAM on-chip e uma largura de banda de inferência de até 150 TB/s, embora com uma capacidade de cálculo de ponto flutuante relativamente baixa, não sendo adequado para treino de modelos. Esta arquitetura pode fazer com que o seu pico de desempenho fique abaixo do limite de desempenho atualmente controlado pelos exportes nos EUA (TPP < 21.000 e largura de banda de DRAM < 6.500 GB/s), permitindo assim evitar as restrições de exportação impostas a GPUs como a H200. No entanto, na solução original da Nvidia, o Groq LPU deve ser utilizado em combinação com a GPU Vera Rubin, que não pode ser exportada para a China (recomendando-se uma proporção de cerca de 25:75). A versão chinesa precisará de adaptar-se a outros sistemas para funcionar de forma independente, sendo que o desempenho real ainda está por ser avaliado.