L’Initiative Open Supply (OSI) a a publié sa définition officielle de l’intelligence artificielle « ouverte »ouvrant la voie à un affrontement avec des géants de la technologie comme Meta, dont les modèles ne correspondent pas aux règles.
OSI établit depuis longtemps la norme de l’industrie en matière de logiciels open supply, mais les systèmes d’IA incluent des éléments qui ne sont pas couverts par les licences conventionnelles, comme les données d’entraînement des modèles. Désormais, pour qu’un système d’IA soit considéré comme véritablement open supply, il doit fournir :
- Accès aux détails sur les données utilisées pour entraîner l’IA afin que d’autres puissent la comprendre et la recréer
- Le code complet utilisé pour créer et exécuter l’IA
- Les paramètres et poids de l’entraînement, qui aident l’IA à produire ses résultats
Cette définition remet directement en query le lama de Meta, largement présenté comme le plus grand modèle d’IA open supply. Llama est accessible au public pour téléchargement et utilisation, mais il est soumis à des restrictions d’utilisation commerciale (pour les functions avec plus de 700 thousands and thousands d’utilisateurs) et ne donne pas accès aux données de formation, ce qui les rend en deçà des normes OSI en matière de liberté illimitée d’utilisation, de modification et de partage.
La porte-parole de Meta, Religion Eischen, a déclaré Le bord que même si « nous sommes d’accord avec notre partenaire OSI sur de nombreux factors », la société n’est pas d’accord avec cette définition. « Il n’existe pas de définition distinctive de l’IA open supply, et la définir constitue un défi automobile les définitions open supply précédentes n’englobent pas la complexité des modèles d’IA actuels qui évoluent rapidement. »
« Nous continuerons à travailler avec OSI et d’autres groupes industriels pour rendre l’IA plus accessible et gratuite de manière responsable, quelles que soient les définitions strategies », a ajouté Eischen.
Depuis 25 ans, la définition du logiciel open supply donnée par OSI est largement acceptée par les développeurs qui souhaitent s’appuyer sur le travail de chacun sans craindre de poursuites judiciaires ou de pièges liés aux licences. Aujourd’hui, alors que l’IA remodèle le paysage, les géants de la technologie sont confrontés à un choix essential : adopter ces principes établis ou les rejeter. La Fondation Linux a également fait une tentative récente pour définir « l’IA open supply », signalant un débat croissant sur la manière dont les valeurs traditionnelles de l’open supply s’adapteront à l’ère de l’IA.
« Maintenant que nous avons une définition solide en place, nous pouvons peut-être lutter plus agressivement contre les entreprises qui ‘open washing’ et déclarent leur travail open supply alors qu’en réalité ce n’est pas le cas », Simon Willison, chercheur indépendant et créateur de l’open supply. -source Datasette multi-outils, dit Le bord.
Clément Delangue, PDG de Hugging Face, a qualifié la définition d’OSI de « une aide considérable pour façonner le débat sur l’ouverture de l’IA, en particulier lorsqu’il s’agit du rôle essential des données de formation. »
Le directeur exécutif d’OSI, Stefano Maffulli, affirme qu’il a fallu deux ans, en advisor des consultants du monde entier, pour affiner cette définition grâce à un processus collaboratif. Cela impliquait de travailler avec des consultants du monde universitaire en apprentissage automatique et en traitement du langage naturel, des philosophes, des créateurs de contenu du monde Artistic Commons, and so on.
Alors que Meta évoque des problèmes de sécurité pour restreindre l’accès à ses données de formation, les critiques y voient un motif plus easy : minimiser sa responsabilité légale et préserver son avantage concurrentiel. De nombreux modèles d’IA sont presque certainement formés sur du matériel protégé par le droit d’auteur ; en avril, Le New York Instances signalé que Meta a reconnu en interne qu’il y avait du contenu protégé par le droit d’auteur dans ses données de formation « parce que nous n’avons aucun moyen de ne pas collecter cela ». Il existe une litanie de poursuites contre Meta, OpenAI, Perplexity, Anthropic et d’autres pour violation présumée. Mais à de rares exceptions près – comme Secure Diffusion, qui révèle ses données de formation – les plaignants doivent actuellement s’appuyer sur des preuves circonstancielles pour démontrer que leur travail a été supprimé.
Pendant ce temps, Maffulli voit l’histoire de l’open supply se répéter. « Meta avance les mêmes arguments » que Microsoft dans les années 1990 lorsqu’il considérait l’open supply comme une menace pour son modèle économique, a déclaré Maffulli. Le bord. Il se souvient que Meta lui avait parlé de son investissement intensif dans Llama, lui demandant « qui, à votre avis, sera succesful de faire la même selected ? Maffulli a vu un schéma familier : un géant de la technologie utilisant le coût et la complexité pour justifier le verrouillage de sa technologie. « Nous revenons aux premiers jours », a-t-il déclaré.
« C’est leur sauce secrète », a déclaré Maffulli à propos des données d’entraînement. « C’est la précieuse propriété intellectuelle. »