Une nouvelle phase de développement de l'IA crée des opportunités de croissance pour les entreprises technologiques
La forte augmentation du nombre de jetons d'IA générés - de petites unités de données que les modèles d'IA utilisent pour construire du texte, des images ou des décisions - permet de nouvelles applications d'IA et fournit plus d'intelligence, explique Richard Clode, gestionnaire de portefeuille chez Janus Henderson.
Selon Richard Clode, les chiffres sont éloquents. Microsoft a déclaré que le nombre de jetons d'IA générés avait été multiplié par cinq d'une année sur l'autre, pour atteindre le chiffre impressionnant de 100 000 milliards de jetons au cours du premier trimestre de cette année. Google, quant à lui, traite plus de 480 billions de jetons par mois, soit 50 fois plus qu'un an auparavant. NVIDIA a même vu le nombre de jetons générés décupler au cours de l'année écoulée.
Cette augmentation considérable du nombre de jetons générés marque un changement dans le monde de l'IA : l'accent n'est plus mis sur la formation à l'IA mais sur son utilisation, également connue sous le nom d'inférence. Alors que l'accent était auparavant mis sur la formation de modèles de plus en plus grands, l'accent est désormais mis sur l'application dans le monde réel - des robots de service à la clientèle aux véhicules autonomes en passant par les logiciels pilotés par des agents.
Du chatbot à la machine intelligente
L'essor des soi-disant modèles de raisonnement - des systèmes d'IA qui analysent des questions complexes, envisagent des alternatives et vérifient leur réponse - joue un rôle clé à cet égard. Selon NVIDIA, une action de raisonnement avancée nécessite 100 à 1 000 fois plus de puissance de calcul qu'une simple interaction avec un chatbot. Cela génère exponentiellement plus de jetons et ouvre la porte à de nouvelles applications telles que les assistants IA pour les entreprises et les robots humanoïdes.
Ces modèles de raisonnement ne sont pas seulement plus intelligents, ils requièrent également plus de puissance de calcul. Cela signifie plus d'infrastructures, plus de puces et plus de demande d'énergie. Mais parce qu'ils sont également plus performants et qu'ils apportent plus de valeur ajoutée, le retour sur investissement de l'IA est de plus en plus évident. Cela rend les dépenses en matière d'IA plus durables et plus attrayantes pour les gouvernements et les entreprises.
La puce Blackwell annonce une nouvelle ère
Pour faire face à cette nouvelle génération de modèles de raisonnement IA, NVIDIA a développé sa puce Blackwell, qui offre des performances de traitement jusqu'à 40 fois supérieures à celles de la génération précédente de puces Hopper. Le lancement de Blackwell a d'abord connu des difficultés : remaniements chez TSMC, problèmes de circuits imprimés, retards de production. Mais aujourd'hui, le déploiement semble décoller. Selon NVIDIA, une moyenne de 1 000 racks NVL72 sont désormais livrés par semaine, soit 72 000 GPU Blackwell. Le Blackwell Ultra GB300, encore plus puissant, est également en route. Une augmentation substantielle de la capacité est attendue à partir du second semestre 2025.
Une vague d'IA structurelle et durable
Les investisseurs et les marchés considèrent principalement les résultats trimestriels de NVIDIA comme un baromètre du secteur de l'IA. Mais ceux qui se concentrent uniquement sur le court terme passent à côté de l'essentiel, selon M. Clode. Selon lui, le passage des modèles d'apprentissage aux modèles de raisonnement marque le début d'une nouvelle phase structurelle dans le développement de l'IA.
Avec l'utilisation croissante de l'IA, les nouvelles applications et les preuves de rentabilité, les bases d'un cycle de croissance durable et à long terme ont été jetées. La demande d'infrastructures d'IA évolue tant en qualité qu'en ampleur.
Pour en savoir plus, lisez l'article Are NVIDIA investors missing the woods for the trees? de Richard Clode, Portfolio Manager chez Janus Henderson.
Serge Vanbockryck