Google ne dispose pas de tous les GPU nécessaires pour que Gemini fonctionne sur iPhone
Depuis quelques jours, le monde de la technologie est très agité avec l'annonce selon laquelle Apple pourrait conclure un accord avec Google pour implémentez votre Gemini AI dans iOS 18. Cela a fait l’effet d’une bombe, et plusieurs médias l’ont corroboré. Il semble donc qu’il y ait une part de vérité dans toute cette histoire. Par exemple, parvenir à une IA au niveau du nouveau ChatGPT-4 est très difficile. Maintenant qu'il y a tant de nouvelles sur les IA, les gens ne se rendent pas compte à quel point il est incroyablement compliqué de faire fonctionner ces systèmes correctement, car étant donné qu'il existe désormais tant de possibilités offertes par tant d'entreprises, il semble que ce soit quelque chose de relativement facile à mettre en œuvre. atteindre. Mais ce n’est pas le cas, et Apple le sait probablement bien, alors qu’ils développent également leurs propres IA génératives et d’autres fonctionnalités basées sur cette technologie. Par conséquent, il est peut-être préférable d’utiliser une IA d’une entreprise rivale pour s’associer, plutôt que d’essayer d’intégrer l’une des vôtres qui n’atteindra pas le même niveau.
Nous ne savons toujours pas si l'une de ces prétendues négociations est vraie car, évidemment, ni Apple ni Google n'ont dit un seul mot publiquement, mais supposons que ce soit le cas, qu'Apple intègre Gemini dans iOS 18. Que se passerait-il alors ? – La réponse pourrait vous surprendre.
Gemini, le rival de ChatGPT-4
Gemini est un grand modèle de langage multimodal développé par Google DeepMind et rivalise fondamentalement avec ChatGPT-4 d'OpenAI. Il a été présenté en décembre 2023 et Google prévoit une série de niveaux d'utilisation avec des prix différents, pour les utilisateurs qui souhaitent accéder à ce système pour rechercher, poser des questions, obtenir des résumés, des conseils, créer des images et bien plus encore. C'est la tendance actuelle. OpenAI, Microsoft, Meta et Google sont les principaux concurrents avec leurs IA génératives respectives, synthétiseurs de texte, d'image ou vidéo.
Actuellement, lorsqu'un utilisateur demande quelque chose dans l'un de ces chats, la requête est envoyée à un ensemble de serveurs qui effectuent une série de calculs dans des réseaux de neurones qui fonctionnent de manière accélérée par des puces spécialisées dans ces tâches, les GPU, bien meilleurs que les CPU. usage général. C'est pourquoi des entreprises comme Nvidia, spécialisées dans les GPU, sont très occupées à se préparer à fournir un nombre jamais vu de ce type de puces pour répondre à l'énorme demande qu'il existe désormais pour ces utilitaires basés sur des modèles d'apprentissage massif qui fonctionnent le mieux dans ces GPU. . Nous parlons de vendre bon nombre de ces puces pour alimenter d’énormes centres de données dotés de serveurs remplis de GPU fonctionnant en parallèle.
Nvidia a récemment présenté sa nouvelle génération de puces Blackwell B200, son premier GPU doté de deux chipsets. Sur leur site Web, ils le disent très clairement : Nous propulsons l’IA générative à l’échelle de milliards de paramètres. Ils font référence à ces modèles massifs de langage ou d'apprentissage dans lesquels d'énormes quantités de données sont utilisées et doivent être se déplacer et digérer dans quelques secondes.
Tout ce déploiement technologique, si rapide et efficace, fait que Nvidia s'élève comme de l'écume au-dessus de nombreuses entreprises technologiques, et elles sont aujourd'hui à la tête de ce nouveau boom des IA.
Les Gémeaux dépendront précisément de ce déploiement. Plus Google prépare de centres de données avec ces puces Nvidia, plus il aura de capacité pour répondre à la demande de nouvelle IA générative.
Le volume de demande potentielle d’IA générative que représenterait l’iPhone
La chose la plus intéressante dans cette rumeur selon laquelle Apple pourrait utiliser Gemini dans iOS 18 est l'énorme volume de demande que cela entraînerait pour Google. Lorsqu'Apple fabrique un nouveau modèle d'iPhone avec de nouveaux composants, le même problème se pose toujours. Il n’est pas facile d’obtenir un nouveau composant au volume de production requis par un iPhone. Par exemple, il n’est pas facile pour une petite entreprise de Taiwan, de Chine ou du Japon de fabriquer 200 millions d'un composant par an. Par exemple, un module caméra pour iPhone représente pour son fabricant, Sony, un investissement important en usines et en personnel exclusivement pour ce composant. Cela ne vaut pas 100 000, un demi-million ou même dix millions, mais il faut fabriquer des centaines de millions de quelque chose de nouveau, et puis marier tous ces procès avec littéralement des centaines de composants différents, qui Ils doivent tous être au même endroit, au même momentafin que des entreprises comme Foxconn ou Pegatron puissent les assembler dans un nouvel iPhone.
Afin de répondre à une demande de plusieurs centaines de millions de personnes, dont beaucoup pourraient adresser une pétition à Gemini simultanément, Nous avons besoin de plus de serveurs équipés de ces GPU Nvidia que Google n'en a actuellement. À l'heure actuelle, nous nous demandons si mettre Gemini sur l'iPhone directement avec une mise à jour iOS 18 pourrait être techniquement possible. Cette difficulté pourrait en fait être l'une des principales raisons qui pourraient pousser Apple à négocier avec Google l'intégration de ses IA génératives dans iOS 18 au lieu de développer exclusivement les siennes, ou du moins de le faire en parallèle.
conclusion
Il sera intéressant de voir comment Apple rejoint le parti de l'IA générative, avec ses propres solutions ou en collaboration avec Gemini de Google, et comment le développement de ces nouvelles technologies basées sur des techniques d'intelligence artificielle est adapté pour pouvoir résister à l'énorme demande de faire n'importe quoi sur un iPhone.
Des mois de nouvelles assez spectaculaires nous attendent dans le monde de la technologie.