Nouvelles

Openai dit que Deepseek a copié le chatpt, mais il fait également face à des allégations de droits d'auteur

Jusqu'à il y a quelques semaines, peu de gens dans le monde occidental avaient entendu parler d'une petite entreprise chinoise d'intelligence artificielle (IA) connue sous le nom de Deepseek. Mais le 20 janvier, ça Attention mondiale capturée Lorsqu'il a publié un nouveau modèle d'IA appelé R1.

R1 est un modèle de «raisonnement», ce qui signifie qu'il fonctionne sur les tâches étape par étape et détaille son processus de travail à un utilisateur. C'est une version plus avancée de Deepseek Modèle V3qui a été publié en décembre. La nouvelle offre de Deepseek est presque aussi puissante que le modèle d'IA le plus avancé de la société rival Openai, mais à une fraction du coût.

En quelques jours, l'application de Deepseek a dépassé Chatgpt dans de nouveaux téléchargements et fixé les cours des actions des sociétés technologiques aux États-Unis culbutage. Il a également conduit Openai à réclamer que son rival chinois avait effectivement piloté certains des joyaux de la couronne des modèles d'Openai pour construire le sien.

Dans un Déclaration au New York Timesla société a déclaré:

Nous savons et examinons les indications que Deepseek peut avoir distillé de manière inappropriée nos modèles et partagerons des informations comme nous en savons plus. Nous prenons des contre-mesures agressives et proactives pour protéger notre technologie et continuerons de travailler en étroite collaboration avec le gouvernement américain pour protéger les modèles les plus capables en cours de construction ici.

La conversation a approché Deepseek pour commenter, mais elle n'a pas répondu.

Mais même si Deepseek a copié – ou, dans le langage scientifique, «distillé» – au moins une partie de Chatgpt pour construire R1, il convient de se rappeler qu'Openai est également accusé de manque de respect à la propriété intellectuelle tout en développant ses modèles.

Qu'est-ce que la distillation?

La distillation du modèle est une technique d'apprentissage automatique courante dans laquelle un «modèle d'élève» plus petit est formé aux prédictions d'un «modèle d'enseignant» plus grand et plus complexe.

Une fois terminé, l'élève peut être presque aussi bon que l'enseignant, mais représentera les connaissances de l'enseignant plus efficacement et de manière compacte.

Pour ce faire, il n'est pas nécessaire d'accéder au fonctionnement interne de l'enseignant. Tout ce que l'on a besoin pour réussir cette astuce est de poser suffisamment de questions à l'enseignant pour former l'élève.

C'est ce que Openai prétend que Deepseek a fait: a interrogé O1 d'Openai à une échelle massive et a utilisé les résultats observés pour former les modèles plus efficaces de Deepseek.

Une fraction des ressources

En profondeur réclamations Le fait que la formation et l'utilisation de R1 ne nécessitaient qu'une fraction des ressources nécessaires pour développer les meilleurs modèles de leurs concurrents.

Il y a des raisons d'être sceptiques quant à une partie du battage médiatique de l'entreprise – par exemple, un Nouveau rapport indépendant suggère que la dépense matérielle pour R1 était aussi élevée que 500 millions de dollars américains. Mais même ainsi, Deepseek a toujours été construit très rapidement et efficacement par rapport aux modèles rivaux.

Cela peut être dû au fait que Deepseek Distillé Openai est la production. Cependant, il n'y a actuellement aucune méthode pour le prouver de manière concluante. Une méthode qui en est aux premiers stades de développement est Affiche Ai Sormes. Cela ajoute des modèles invisibles aux sorties, similaires à ceux appliqués aux images protégées par le droit d'auteur. Il existe différentes façons de le faire en théorie, mais aucun n'est suffisamment efficace pour l'avoir mis en pratique.

Il existe d'autres raisons qui aident à expliquer le succès de Deepseek, comme le travail technique profond et difficile de l'entreprise.

Les progrès techniques réalisés par Deepseek comprenaient des puces AI moins puissantes mais moins chères (également appelées unités de traitement graphique, ou GPU).

Deepseek n'avait pas d'autre choix que de s'adapter après le Les États-Unis ont interdit les entreprises De l'exportation des puces d'IA les plus puissantes à la Chine.

Alors que les entreprises de l'IA occidentale peuvent acheter ces unités puissantes, l'interdiction d'exportation a forcé les entreprises chinoises à innover pour tirer le meilleur parti d'alternatives moins chères.

Les États-Unis ont interdit l'exportation des puces informatiques les plus puissantes vers la Chine. Ni Gal / Shutterstock

Une série de poursuites

Openai conditions d'utilisation Énoncer explicitement que personne ne peut utiliser ses modèles d'IA pour développer des produits concurrents. Cependant, ses propres modèles sont formés sur des ensembles de données massifs grattés du Web. Ces ensembles de données contenaient une quantité substantielle de matériel protégé par le droit d'auteurqui Openai dit qu'il a le droit d'utiliser sur la base de «l'utilisation équitable»:

La formation des modèles d'IA utilisant des matériaux Internet accessibles au public est une utilisation équitable, comme le soutient les précédents de longue date et largement acceptés. Nous considérons ce principe comme juste pour les créateurs, nécessaires aux innovateurs et critique pour la compétitivité américaine.

Cet argument sera testé devant le tribunal. Journaux, musiciens, auteurs Et d'autres créatifs ont déposé une série de poursuites contre Openai pour la violation du droit d'auteur.

Bien sûr, cela est assez distinct de ce qu'Openai accuse Deepseek de faire. Néanmoins Openai n'attire pas beaucoup de sympathie pour son affirmation selon laquelle Deepseek a récolté illégalement sa production de modèle.

La guerre des mots et des poursuites est un artefact de la façon dont la progression rapide de l'IA a dépassé le développement de règles juridiques claires pour l'industrie. Et bien que ces événements récents puissent réduire le pouvoir des opérateurs opérationnels de l'IA, beaucoup dépend de l'issue des divers litiges juridiques en cours.

Secouer la conversation mondiale

Deepseek a montré qu'il est possible de développer des modèles de pointe à moindre coût et efficacement. Il reste à voir s'ils peuvent rivaliser avec OpenAI sur un terrain de jeu.

Au cours du week-end, Openai a tenté de démontrer sa suprématie par libération publique Son modèle de consommation le plus avancé, O3-Mini.

OpenAI affirme que ce modèle surpasse considérablement même sa propre version précédente de la tête du marché, O1, et est le «modèle le plus rentable de notre série de raisons».

Ces développements annoncent une ère de choix accru pour les consommateurs, avec une diversité de modèles d'IA sur le marché. C'est une bonne nouvelle pour les utilisateurs: les pressions concurrentielles rendront les modèles moins chers à utiliser.

Et les avantages s'étendent davantage.

La formation et l'utilisation de ces modèles place un tension massive sur la consommation mondiale d'énergie. À mesure que ces modèles deviennent plus omniprésents, nous bénéficions tous d'améliorations à leur efficacité.

La montée de Deepseek marque certainement un nouveau territoire pour la construction de modèles à moins cher et efficacement. Peut-être que cela secouera également la conversation mondiale sur la façon dont les entreprises d'IA devraient collecter et utiliser leurs données de formation.La conversation

(Auteur: Lea FremannMaître de conférences en traitement du langage naturel, Université de Melbourne, L'Université de Melbourne et Shananan CohneyMaître de conférences en cybersécurité, L'Université de Melbourne)

Cet article est republié à partir de La conversation sous une licence créative Commons. Lire le article original.

(À l'exception du titre, cette histoire n'a pas été éditée par le personnel de NDTV et est publiée à partir d'un flux syndiqué.)


Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button