Microsoft vient de prendre le pied de l’accélérateur AI. Devons-nous nous inquiéter?
Dans la course à enjeux élevés pour dominer l’infrastructure d’IA, un géant géant de la technologie subtile des engrenages a changé.
Depuis que Chatgpt a éclaté sur scène à la fin de 2022, il y a eu un tableau de bord fou pour construire autant de centres de données d’IA que possible. Big Tech dépense des centaines de milliards de dollars sur des terrains, des équipements de construction et informatiques pour prendre en charge de nouvelles charges de travail génératrices de l’IA.
Microsoft est primordial pour cela, généralement en raison de sa collaboration avec Openai, le créateur de Chatgpt.
Il n’y a presque aucun doute sur l’industrie technique de cette expansion de l’IA pendant deux ans. Tout est mauvais Vers le haut et à droite.
Jusqu’à récemment, c’est.
Rythme-plans
Mardi dernier, Noelle Walsh, responsable des opérations de Microsoft Cloud, a déclaré que la société « pouvait accélérer stratégiquement ».
C’est une nouvelle assez choquante pour une industrie de l’IA qui donne constamment des coups de pied et crie pour plus de capacité cloud et plus de GPU NVIDIA. Il vaut donc la peine de lire ce que Walsh a écrit sur la façon dont les choses ont changé:
« Ces dernières années, la demande de nos services cloud et d’IA a augmenté plus que ce que nous aurions jamais pu prévu et pour obtenir cette opportunité, nous avons commencé à réaliser l’échelle d’infrastructure la plus grande et la plus ambitieuse de notre histoire », a-t-elle écrit dans un message sur LinkedIn.
« Par nature, chaque nouvelle entreprise importante a besoin d’agilité et de raffinement sur cette taille et cette échelle pendant que nous apprenons et grandissons avec nos clients. Ce que cela signifie, c’est que nous retardons ou pauses certains projets de phases précoces », a ajouté Walsh.
Microsoft s’est récemment retiré un peu
Elle n’a pas partagé plus de détails, mais l’analyste de TD Cowen Michael Elias a trouvé plusieurs exemples récents de ce qu’il a dit que Microsoft était en arrière.
Au cours des six derniers mois, le géant de la technologie s’est enfui de plus de 2 Gigawatts de la capacité de cloud AI aux États-Unis et en Europe qui était occupée à être loué, a-t-il déclaré. Au cours du dernier mois environ, Microsoft a également reporté et annulé les accords de location de centre de données existants aux États-Unis et en Europe, a écrit Elias dans un récent mémorandum aux investisseurs.
Ce retrait sur la location de nouvelles capacités a été largement alimenté par la décision de Microsoft de ne pas prendre en charge une charge de travail de formation Openai incrémentielle, a déclaré Elias. Un changement récent à ce partenariat crucial permet à OpenAI de travailler avec d’autres fournisseurs de cloud en dehors de Microsoft.
« Cependant, nous continuons de croire que l’anniversaire de bail et l’affichage de la capacité indiquent une offre excédentaire du centre de données par rapport aux prévisions actuelles de la demande », a ajouté Elias.
Cela est inquiétant car des milliards de dollars d’investissements actuels et planifiés fonctionnent sur l’arbre générateur de l’IA qui se poursuivra à un rythme rapide. Avec autant d’argent sur la ligne, chaque soupçon est que cette fusée ne se tient pas à la vitesse du nerf léger. (J’ai interrogé un porte-parole de Microsoft à ce sujet deux fois et j’ai reçu aucune réponse.)
Une Ai -Herkalibration, pas de retraite
Cependant, la réalité est plus nuancée qu’un simple retrait. Ce dont nous sommes témoins est une herkalibration – pas une retraite.
L’analyste de Barclays Raimo Lenschow a mis la situation en contexte. La première vague de cette industrie passe beaucoup de choses visant à sécuriser le pays et les bâtiments pour accueillir toutes les puces et autres équipements informatiques nécessaires pour créer et effectuer des modèles et services d’IA.
Dans le cadre de cette « saisie de terrains » de l’IA, il est courant que les grandes sociétés de cloud signeront et négocier avec les contrats de location qu’ils s’enfuient plus tard, a expliqué Lenschow.
Maintenant que Microsoft se sent plus à l’aise avec la quantité de terrains à portée de main, l’entreprise déplace probablement certaines dépenses vers les phases ultérieures qui se concentrent davantage sur l’achat des GPU et d’autres équipements informatiques qui entrent dans ces nouveaux centres de données.
« En d’autres termes, au cours des derniers trimestres, Microsoft a » trop de temps « sur les terres et les bâtiments, mais remonte maintenant à une cadence plus normale », a écrit Lenschow dans une note récente aux investisseurs.
Microsoft prévoit toujours 80 milliards de dollars de dépenses en capital au cours de l’année d’imposition de 2025 et a conduit à une croissance d’une année sur l’année au cours de la prochaine année d’imposition. Ainsi, l’entreprise n’est probablement pas beaucoup de retour de l’IA, mais devient plus stratégique sur l’endroit où et comment il investit.
De la formation de l’IA
En conséquence, une partie du quart semble être une formation en IA. La pré-formation est la façon dont les nouveaux modèles sont fabriqués, ce qui nécessite beaucoup de GPU étroitement liés, ainsi que des réseaux de pointe. Des choses chères! Il est suivi que des modèles existants soient effectués pour soutenir des services tels que les agents d’IA et les copilotes. L’inférence est techniquement moins exigeante, mais devrait être le plus grand marché.
Avec l’inférence qui dépasse la formation, l’accent se déplace vers une infrastructure évolutive et rentable qui maximise l’efficacité des investissements.
Lors d’une récente conférence sur l’IA à New York, par exemple, la discussion était plus axée sur l’efficacité que sur la réalisation de l’AGI, ou l’intelligence générale artificielle, une entreprise précieuse pour faire fonctionner les machines mieux que les gens.
La startup AI Cohere a noté que sa nouvelle commande selon laquelle un modèle n’a besoin que de deux GPU pour être effectués. C’est bien inférieur à la plupart des modèles ces dernières années.
Le chef de l’IA de Microsoft pèse
Mustafa Suleyman, PDG de Microsoft AI, l’a répété dans un podcast récent. Bien qu’il ait reconnu un léger retard dans l’efficacité des courses de pré-formation massives, il a souligné que la consommation de calcul de l’entreprise est toujours « incroyablement » qui se déplace vers différentes étapes du pipeline d’IA.
Suleyman a également précisé que certains des contrats et projets de location annulés n’avaient jamais été terminés de contrats, mais plutôt des discussions exploratoires – une partie de la procédure opérationnelle standard dans la planification du cloud hyperscale.
Ce pivot stratégique est fourni comme OpenAI, le partenaire le plus proche de Microsoft, a commencé à acheter la capacité d’autres fournisseurs de cloud et même des conseils sur le développement de ses propres centres de données. Cependant, Microsoft maintient le droit du premier refus de la nouvelle capacité OpenAI, indiquant l’intégration profonde constante entre les deux sociétés.
Qu’est-ce que tout cela signifie?
Au début, ne faites aucune flexibilité avec la faiblesse. Microsoft s’adapte probablement à l’évolution de la dynamique du marché, et non pour réduire l’ambition. Deuxièmement, l’espace hyperscaleur reste incroyablement compétitif.
Selon Elias, lorsque Microsoft s’est éloigné de la capacité sur les marchés étrangers, Google est monté à bord pour briser l’offre. En attendant, Meta a rempli la capacité que Microsoft avait laissée sur la table aux États-Unis.
« Les deux hyperscaleurs sont situés au milieu d’une allée matérielle sur une base annuelle dans la demande de centre de données », a écrit Elias, se référant à Google et Meta.
Ainsi, le pivot de Microsoft est peut-être plus un signe de maturité que le retrait. Étant donné que l’AI-Adoption commence sa prochaine phase, les gagnants ne sont pas nécessairement ceux qui dépensent le plus – mais ceux qui dépensent les plus intelligents.