NVIDIA, le fondateur Jensen Huang, a proposé le concept innovant du « gâteau à cinq couches » pour expliquer ce qu’est réellement l’intelligence artificielle. Il raconte une histoire de manière créative pour aider le grand public à comprendre que l’IA n’est pas simplement une puce, un modèle, un matériel ou une application, mais un système complet d’intelligence qui se développe depuis la couche fondamentale d’énergie jusqu’aux puces, infrastructures, modèles et applications.
Que signifie l’architecture du gâteau à cinq couches de Jensen Huang ?
Jensen Huang décompose l’intelligence artificielle en cinq couches empilées, dont la base commence par l’énergie (Energy). En essence, l’intelligence générée en temps réel résulte de la conversion d’énergie, l’alimentation électrique étant la contrainte fondamentale de la production d’intelligence ; au-dessus se trouve la couche des puces (AI Chips), ces processeurs qui convertissent efficacement l’électricité en capacité de calcul, leur bande passante et leur technologie d’interconnexion déterminant le coût et l’échelle de la production d’intelligence ; la troisième couche est l’infrastructure (Infrastructure), comprenant les centres de données, les systèmes de refroidissement et les réseaux, ces installations, appelées « usines d’IA » (AI Factories), conçues non seulement pour stocker des données, mais pour digérer et comprendre d’énormes volumes d’informations afin que l’IA puisse apprendre ; la quatrième couche concerne les modèles (Models), qui traitent non seulement le langage et les données, mais aussi approfondissent des domaines comme la biologie, la chimie et la physique. La couche supérieure est celle des applications (Applications), telles que la conduite autonome, la robotique, la biotechnologie et la médecine, représentant la réalisation la plus élevée de la valeur économique de l’IA.
Comment l’IA naît-elle ?
Jensen Huang explique que dans l’histoire de l’informatique, le logiciel était essentiellement préenregistré (Pre-recorded) : les humains écrivaient des algorithmes, structuraient soigneusement les données, puis les stockaient dans des tableaux, et utilisaient SQL pour des recherches précises. C’était une époque où « les instructions précédaient, les données étaient contraintes ».
Mais l’IA a complètement bouleversé ce cadre.
C’est la première fois que l’ordinateur peut comprendre des informations non structurées : il peut reconnaître des images, lire du texte, écouter des sons et en comprendre la signification, et même faire des inférences sur le contexte et l’intention. Plus important encore, il peut générer de l’intelligence en temps réel. Chaque réponse est entièrement nouvelle, chaque réponse dépend du contexte fourni par l’humain. Il ne s’agit plus d’une recherche dans des instructions préenregistrées, mais d’un raisonnement instantané, générant une intelligence artificielle adaptée aux besoins humains.
Le premier ordinateur que l’humain possède n’est plus une machine rigide, mais un « cerveau » capable de comprendre des informations non structurées : il peut lire des images et du texte, écouter de la musique, converser avec des humains, et même inférer des réponses aux besoins humains.
L’énergie (Energy) alimente la puissance de calcul de l’IA
La couche la plus basse de l’architecture de l’IA est l’énergie. L’IA générée en temps réel nécessite de l’électricité pour fonctionner : chaque token produit résulte de la conversion du courant électrique en capacité de calcul. L’énergie est le principe fondamental de l’infrastructure de l’IA et la contrainte principale limitant la quantité d’IA que le système peut produire.
Les modèles d’IA aident l’humanité à digérer d’énormes volumes d’informations
Les modèles d’IA peuvent comprendre divers types d’informations, y compris le langage, la biologie, la chimie, la physique, la finance, la médecine, et le monde réel lui-même. Les grands modèles de langage en sont un exemple ; parmi les développements les plus révolutionnaires figurent l’IA pour les protéines, l’IA chimique, la simulation physique, la robotique et les systèmes autonomes. L’IA aide l’humanité à comprendre plus rapidement des informations complexes. Par exemple, dans la radiologie, l’IA assistée par image permet aux médecins de se concentrer davantage sur les soins aux patients et le diagnostic clinique, réduisant la charge de travail des professionnels de santé et améliorant la qualité des soins.
L’usine d’IA lance la transformation infrastructurelle à l’échelle mondiale
L’IA déclenche une vague sans précédent de construction d’infrastructures dans l’histoire humaine. Bien que sa force principale réside dans des algorithmes complexes, cette révolution numérique repose également sur une infrastructure physique massive, allant des centres de données aux « usines d’IA ». La construction de ces équipements matériels a créé une demande explosive pour des techniciens spécialisés, faisant des compétences techniques avancées un pilier indispensable de cette vague technologique.
Les applications au sommet du gâteau apportent l’intelligence dans le monde physique
Au sommet de l’architecture du gâteau à cinq couches, l’IA transforme la technologie en valeur économique concrète à travers diverses applications. Le développement ne se limite plus à la simple conversation textuelle, mais s’étend aux applications physiques dans le monde réel : par exemple, dans la biotechnologie, des plateformes d’IA pour la recherche de médicaments peuvent simuler précisément la structure des protéines ; dans la mobilité, la conduite autonome intègre l’IA dans les véhicules ; les robots humanoïdes peuvent effectuer des tâches en usine ou à domicile. Ces scénarios d’application entraînent une transformation industrielle mondiale.
Cet article, Jensen Huang utilise la métaphore du « gâteau à cinq couches » pour expliquer l’évolution de l’intelligence artificielle, publié à l’origine par Chain News ABMedia.