Modelo LLM Qwen modificado por Apple para conseguir mejoras en la calidad del código que puede generar

Apple expériences avec le modèle LLM Qwen obtenant de meilleurs résultats lors de la programmation

Beaucoup sont curieux de savoir ce qu'ils peuvent faire dans Apple avec des modèles LLM, c'est-à-dire de grands modèles linguistiques, une technologie probabiliste ou un modèle de diffusion utilisé pour faire fonctionner le désormais omniprésent et mal appelé Intelligences artificielles o ias. Le prochain Siri doit être basé sur cette technologie pour devenir quelque chose de peu utile, et bien qu'Apple considère les modèles LLM d'autres sociétés, il développe également ses propres modèles. Ce sont ceux que nous voulons voir. Mais, en même temps, Dans Apple, ils éprouvent des modèles LLM open source Essayer d'obtenir de meilleurs rendements basés sur des modèles avec un ensemble de données relativement réduit, idéal pour travailler localement sur des appareils avec moins de ressources, comme un smartphone.

Tout le monde peut installer ces modèles open source sur son PC ou Mac domestique en utilisant Olllama par exemple, puis modifier les paramètres avec lesquels il fonctionne pour obtenir différents résultats de performances. C'est exactement ce qu'ils ont fait à Apple en utilisant Qwen2.5-7bun modèle créé par Alibaba en Chine, accessible au public, avec 7 000 millions de paramètres (c'est pourquoi 7b en son nom).

La différence est que les programmeurs Apple ont modifié ce modèle et publié de retour le résultat dans un visage étreint, l'un des modèles LLM les plus connus. Ils l'ont appelé Qwen2.5 – Coder-7bet comme vous pouvez le voir par votre nom, vous vous spécialisez dans la programmation de code avec une différence intéressante; Il est capable de générer du code fonctionnel sans avoir à l'écrire de gauche à droite et de haut en bas comme les autres modèles, de sorte qu'il est littéralement capable de démarrer la maison par le toit et de remplir le reste du programme demandé, réalisant ainsi des améliorations de performances qui soulèvent ce modèle au-dessus de ce qui avait été mesuré auparavant.

Cela parvient à modifier le paramètre de températureque dans Modèles LLM définit le niveau de flexibilité ou de créativité qui est autorisé à exécuter à partir de la demande qui a été faite. Le modèle avec des exemples de code (20 000 au total) choisis avec beaucoup de soin qui sont de bons exemples de programmation de haute qualité se sont également réinscrits.

Model LLM Qwen modifié par Apple pour obtenir des améliorations de la qualité du code qui peut générer

Bien qu'il soit intéressant qu'ils obtiennent de meilleurs résultats avec QWEN que le reste de la communauté consacrée à ces choses, le niveau des résultats n'atteint pas encore le niveau Openai ou Gemini Gmini de Google, en ce moment les modèles les plus principaux pour pratiquement tout. Ce sont eux qui se démarquent toujours dans tous les tests qui sont effectués en vérifiant des centaines de paramètres dans leurs réponses.

Étant donné que les programmeurs Apple modifier et expérimenter avec d'autres modèles sont intéressants, mais encore une fois, nous aimerions voir comment un modèle LLM d'Apple fonctionne, mais avec une forte probabilité, nous ne verrons pas une open source à venir, nous devrons donc attendre pour voir si Siri, en utilisant un modèle LLM d'une Apple, atteint un bon niveau de qualité dans leurs réponses. L'obtention est probablement l'une des priorités les plus élevées d'Apple en ce moment, car l'utilisation d'un modèle LLM étranger implique de payer des milliards de dollars uniquement en ressources dans les centres de données.

A lire également