Apple confirme qu'il n'entraîne pas ses IA avec des données volées

Apple confirme qu'il n'entraîne pas ses IA avec des données volées

Ces derniers jours, il y a eu beaucoup de controverses sur Internet en raison de la confirmation que plusieurs entreprises entraînent leurs grands modèles de prédiction avec des données obtenues à différents endroits sur Internet, parfois sans l'autorisation de leurs auteurs. L'une de ces sociétés est Apple.

Les grands modèles de langage ou d'action, également connus sous le nom de LLM, nécessitent d'énormes quantités de données sur lesquelles former leurs réseaux neuronaux. Ce sont ces systèmes qui permettent aux erreurs d'appel, comme elles abondent aujourd'hui, de fonctionner. Ce que font toutes les entreprises qui développent des systèmes d’intelligence artificielle, c’est les acheter à d’autres entreprises spécialisées dans leur obtention.

Le problème survient lorsqu’un de ces fournisseurs de données obtient les données de manière illégale. Il est important de préciser qu’il n’y a pas de problème de confidentialité, toutes les données qu’ils utilisent sont publiques, mais il y a un problème de droit d’auteur. Ce n’est pas parce que quelque chose est publié et accessible à tout utilisateur de YouTube que cette vidéo peut être prise et utilisée librement, et que la vidéo, ses sous-titres ou ce qui y est dit ne peuvent pas non plus être utilisés sans l’autorisation de son auteur.

C'est exactement ce qui s'est passé cette semaine. Il a été constaté que les transcriptions de plusieurs vidéos de YouTubers célèbres ont été utilisées pour entraîner des systèmes d’intelligence artificielle. Ces transcriptions sont téléchargées par les auteurs des vidéos sur TouTube et, dans certains cas, pour les obtenir de bonne qualité, ces auteurs ont payé de l'argent.

WIRED a publié un article indiquant qu'Apple avait utilisé ses données pour développer ses IA. Cependant, la société a confirmé 9to5Mac, qui ce n'est pas tout à fait vrai. Aucune IA Apple Intelligence n’utilise un modèle d’apprentissage formé sur ces données. Ce qui a utilisé ces données obtenues frauduleusement est OuvrirELMmodèles d'IA qu'Apple publie et utilise librement pour enquêter sur ces systèmes, mais qui ne sont pas et ne seront pas utilisés dans iOS, iPadOS ou macOS.

La cause de tout ce problème réside dans les pratiques honnêtes de ces fournisseurs de contenu, mais en fin de compte, c'est Apple qui paie de l'argent et accepte d'utiliser ces données, on pourrait donc dire qu'ils portent également une certaine responsabilité. Cependant, de nombreuses entreprises ont utilisé ces données, notamment Nvidia et Salesforce.

A lire également