OpenAI chatgpt Donnez-nous votre contenu ou vous mourrez

Le Financial Times Annoncé un accord avec OpenAI lundi, il accordera une licence à son journalisme de classe mondiale pour la formation et l’information Modèles ChatGPT. Il rejoint Axel Springer et Associated Press qui ont conclu des accords similaires, où OpenAI est censé offrir des millions pour le droit d’utiliser le contenu. Cependant, ChatGPT a été formé sur de nombreux autres contenus récupérés sur le Web et non payés par OpenAI. Alors pourquoi OpenAI paie-t-il pour certains ensembles de données et pas pour d’autres ?

181204 Explication des sous-marins Land Mars

Les accords de licence d’OpenAI semblent envoyer un message clair : nous allons utiliser votre contenu de toute façon, alors signez un accord avec nous ou soyez laissé pour compte. Le principal avantage d’un contrat de licence semble occuper une place prépondérante dans les réponses ChatGPT. Certains éditeurs voudront peut-être également consolider leurs relations avec le prochain grand canal de distribution d’informations avant que celui-ci ne prenne le relais. Cependant, il semble qu’OpenAI utilise de toute façon beaucoup de contenu provenant d’éditeurs.

OpenAI forme déjà ses modèles d’IA en partie sur «données accessibles au public» selon la CTO Mira Murati, ce qui semble intentionnellement vague. De toute façon, quelles sont les données accessibles au public ? L’expression suppose tout ce qui peut être lu gratuitement. Internet peut également être intégré gratuitement à ChatGPT. Par exemple, Gizmodo fait partie des « données accessibles au public d’OpenAI ». mis en cache 34 000 fois dans le texte Web GPT-2 ensemble de données, le dernier ensemble de données qu’OpenAI a révélé utiliser pour former un modèle d’IA.

Gizmodo est gratuit pour les lecteurs en grande partie grâce aux publicités sur ce site Web. Si les lecteurs peuvent accéder à notre contenu via ChatGPT, cela brise notre modèle économique. Le New York Times, qui est beaucoup plus utilisé dans l’ensemble de données GPT-2 WebText, a poursuivi OpenAI pour violation du droit d’auteur sur ce même sujet.

Un accord de licence de contenu avec OpenAI semble être le seul moyen pour les éditeurs de rester pertinents à l’ère de l’IA. communiqué de presseLe directeur général du groupe Financial Times, John Ridding, a déclaré que cet accord “élargirait la portée” de son travail tout en offrant “un premier aperçu de la manière dont le contenu émerge grâce à l’IA”.

“Le problème avec l’IA, c’est qu’il ne s’agit pas vraiment d’intelligence artificielle”, a déclaré Matthew Butterick, un avocat représentant Sarah Silverman et d’autres auteurs de livres poursuivant OpenAI, dans une interview avec Gizmodo. “C’est de l’intelligence humaine qui a été collectée à un endroit précis, séparée de ses créateurs, puis cette grande entreprise technologique y met un prix et la vend à quelqu’un d’autre.”

Butterick est le plaignant dans six poursuites en matière de droits d’auteur contre des sociétés d’intelligence artificielle. Il est également écrivain, codeur et concepteur, il dit donc comprendre comment l’IA peut menacer ces industries. D’une manière générale, leurs arguments reposent sur l’affirmation selon laquelle l’IA utilise simultanément le travail des créateurs et menace leurs moyens de subsistance.

Les accords de licence d’OpenAI ont attiré l’attention sur le contenu que ChatGPT utilise gratuitement. Les entreprises technologiques ont fait valoir que l’IA générative constitue une « utilisation équitable » des œuvres protégées par le droit d’auteur, car elle les transforme en quelque chose de nouveau. Le monde de l’IA a également fait valoir qu’il utilise un modèle similaire à la recherche Google, qui met en cache le contenu protégé par le droit d’auteur pour créer un outil de recherche d’informations utile. Comme Google, les chatbots IA ont récemment commencé à inclure des hyperliens. , un tribunal devra décider si l’IA générative est un « usage équitable ».

OpenAI n’a pas immédiatement répondu à la demande de commentaires de Gizmodo.

Les auteurs et les éditeurs de livres ne sont pas les seuls dont OpenAI semble prendre du contenu. Le New York Times a récemment rapporté qu’OpenAI avait formé GPT-4 en version terminée un million d’heures de vidéos YouTube transcrites. Quelques jours avant la publication du rapport, le PDG de YouTube a déclaré que l’utilisation de ses vidéos pour la formation à l’IA constituerait une « violation flagrante » de ses politiques.

Les accords de licence de contenu d’OpenAI brouillent les pistes du débat. L’entreprise utilise d’une manière ou d’une autre le contenu Internet gratuitement, tout en rémunérant d’autres personnes pour leur travail. D’autres entreprises technologiques, comme Apple, auraient été plus proactives en matière de paiement pour toutes leurs données de formation. Adobe aurait payé 3 $ par minute de vidéo pour entraîner votre générateur vidéo IA.

Cependant, il n’est pas clair si même un paiement unique pour obtenir des données de formation à l’IA est suffisant. Nous parlons d’un outil qui pourrait potentiellement bouleverser l’industrie des médias pour les écrivains, les producteurs audio et vidéo, et plus encore. Signer un accord avec OpenAI pourrait vous garantir une bonne place dans les résultats de ChatGPT, mais il semble que le chatbot IA ait de toute façon utilisé votre contenu. Au moins pour l’instant, les sociétés d’IA souhaitent utiliser tout ce qui se trouve sur Internet et poser des questions sur la légalité de tout cela plus tard.

Ce contenu a été automatiquement traduit du matériel original. En raison des nuances de la traduction automatique, il peut y avoir de légères différences. Pour la version originale, cliquez ici.

Related posts