Il y a peu, NVIDIA a conclu une opération intéressante sur le marché de l'inférence.


Elle a acquis l'entreprise de chips de Groq pour 200 milliards de dollars, en intégrant l'équipe clé dirigée par Jonathan Ross.
Ce qui est curieux, c'est que Groq continue d'opérer en tant qu'entreprise indépendante, donc ce n'est pas une absorption totale.

Ce qui m'a attiré l'attention, c'est l'explication de Huang Renxun sur pourquoi ils ont fait cela.
Il s'avère que le marché de l'inférence n'est pas monolithique.
Auparavant, tout tournait autour d'extraire plus de performance, point final.
Mais maintenant, les choses ont changé.
Les utilisateurs sont prêts à payer des prix différents selon la vitesse de réponse.
Si un ingénieur peut traiter des tokens plus rapidement et être plus productif, il est prêt à investir dans cela.

C'est là que Groq intervient.
Son architecture LPU est connue pour ses latences déterministes faibles, à l'opposé de ce que fait NVIDIA avec ses GPU haute performance.
C'est comme s'ils complétaient un spectre : d'un côté, performance maximale ; de l'autre, vitesse de réponse maximale.
Deux segments du marché, deux prix différents, même modèle.

Lors de la conférence GTC de mars, ils ont lancé le Groq 3 LPU avec un procédé de 4 nm de Samsung.
Les chiffres sont impressionnants : 35 fois plus d'efficacité en inférence par mégawatt comparé au Blackwell NVL72.
C'est le type de différenciation qui ouvre de nouveaux marchés plutôt que de simplement concurrencer dans l'existant.

La stratégie de Groq ici est claire : pendant que NVIDIA domine le haut de gamme, ils se spécialisent dans ce dont ont besoin les utilisateurs qui valorisent la vitesse avant tout.
Deux stratégies, un écosystème plus complet.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler