Apple annoncera des améliorations du SDK pour intégrer l'Apple Intelligence dans les applications de troisième partie

L'intelligence artificielle fonctionnant localement sur l'iPhone sera la star de la WWDC 2026

Les modèles d'intelligence artificielle fonctionnant localement sur l'iPhone seront la star de la WWDC 2026, selon The Information. Cela signifie que lorsque vous posez une question à Siri, par exemple, ce sera un modèle LLM qui fonctionne sur l'iPhone qui répondra, donc cela peut fonctionner même si nous n'avons pas de connexion Internet à ce moment-là. Il semble qu'Apple mettra particulièrement l'accent sur ce concept qui évite de devoir envoyer les informations privées de l'utilisateur à n'importe quel serveur sur Internet pour recevoir une réponse.

Apple Intelligence dispose en effet déjà de plusieurs de ses IA qui fonctionnent de cette manière. La méthode pour le faire fonctionner consiste à faire en sorte que le modèle s'adapte à la RAM disponible de l'appareil. Tous les modèles LLM qui fonctionnent localement doivent pouvoir s'insérer dans la mémoire RAM disponible et avec 8 Go de RAM, l'iPhone et tout ordinateur disposant de peu de ressources, comme le MacBook Neo, doivent utiliser un modèle plus petit, appelé modèle distillé ou modèle distillé à partir de modèles plus grands. Bien que l’explication technique soit beaucoup plus complexe, il s’agit d’optimiser les données d’un modèle beaucoup plus vaste pour créer un modèle plus petit et beaucoup plus léger, doté de suffisamment de paramètres pour être utile dans des questions intentionnellement choisies.

Obtenir un bon modèle plus petit et vraiment utile est très difficile. Il est très probable qu'une grande partie du retard dans cette nouvelle version de Siri basée sur Gemini de Google soit retardée précisément parce qu'ils n'ont pas encore atteint des modèles distillés et plus petits qui répondent à ce qu'Apple considère comme exigences minimales pour que Siri soit utile à la majorité des utilisateurs.

Cependant, ce qui est généralement fait est d'utiliser le petit modèle nano localement et lorsque la requête nécessite plus de puissance de raisonnement ou de données mises à jour, il est connecté à Internet pour exécuter un modèle beaucoup plus grand sur un serveur distant. L’idée est qu’il est possible de répondre à n’importe quelle question, mais qu’elle soit résolue localement chaque fois que cela est techniquement possible. Si ce n'est pas le cas, nous nous tournons vers le cloud, de cette façon nous pouvons désormais appeler sur Internet tout ce qui se passe sur un serveur distant.

Tim Cook et Apple Intelligence

Bien qu'il y ait eu des rumeurs selon lesquelles iOS 27 allait se concentrer principalement sur la résolution de bugs et l'amélioration des performances, il semble que ce soit finalement Apple Intelligence avec le nouveau Siri en tête sur lequel Apple va accorder toute son attention cette année.

A lire également