L’avenir incertain de l’IA face à l’épuisement des textes. 2nyz

L’intelligence artificielle (IA), avec des systèmes comme ChatGPT, dépend énormément des vastes collections de textes humains pour s’améliorer. Cette soif insatiable pour de nouvelles données pourrait bien atteindre ses limites, car les mots écrits par les humains ne sont pas une ressource infinie.

La course contre la montre pour les données 69ii

Selon une étude récente de Epoch AI, les entreprises technologiques pourraient épuiser la réserve disponible de données d’entraînement pour les modèles linguistiques d’IA d’ici 2032. Cela est souvent comparé à une « ruée vers l’or » qui finirait par tarir les ressources naturelles, une métaphore utilisée pour illustrer l’urgence et la frénésie autour de l’acquisition de nouvelles données.

ChatGPT : La grosse alerte lancée par les employée d’OpenAi sur des accords curieux signés avec la firme

Se tourner vers des sources alternatives 5o41

À court terme, des entreprises comme OpenAI, créateur de ChatGPT, et Google se précipitent pour sécuriser et parfois payer pour accéder à des sources de données de haute qualité. Ces efforts incluent des accords pour exploiter le flux constant de phrases issues de forums Reddit et de médias d’information.

Le dilemme à long terme 3p6o4z

À plus long terme, la production insuffisante de nouveaux blogs, articles de presse et commentaires sur les réseaux sociaux pourrait ne pas suffire à soutenir la trajectoire actuelle du développement de l’IA. Cela mettrait les entreprises sous pression pour exploiter des données sensibles actuellement considérées comme privées, telles que les e-mails ou les messages textuels, ou pour se reposer sur des « données synthétiques » moins fiables produites par les chatbots eux-mêmes.

Défis et solutions possibles 1j2542

Tamay Besiroglu, auteur de l’étude, met en lumière un « goulot d’étranglement sérieux ». Si les entreprises atteignent ces limites de données, elles ne pourront plus agrandir efficacement leurs modèles. Agrandir les modèles a été jusqu’à présent la méthode principale pour améliorer leurs capacités et la qualité de leurs sorties.

Renforcer l’utilisation des données existantes 4a4dl

Au fil des ans, les chercheurs en IA ont développé de nouvelles techniques pour mieux exploiter les données déjà disponibles, parfois en « sur-entraînant » sur les mêmes sources plusieurs fois. Cependant, ces méthodes atteignent également leurs limites.

Perspectives d’experts extérieurs 5xv60

Nicolas Papernot, professeur adt en génie informatique à l’Université de Toronto, souligne qu’il n’est pas nécessaire de former continuellement des modèles plus grands. Former des modèles plus spécialisés pour des tâches spécifiques pourrait également améliorer les systèmes d’IA. Cependant, il exprime des inquiétudes quant à l’entraînement des systèmes d’IA générative sur les sorties qu’ils produisent eux-mêmes, ce qui peut mener à une baisse de performance connue sous le nom de « collapse du modèle ».

Réflexion sur les données créées par l’homme 6h5c4k

Ceux qui gèrent les trésors de données les plus recherchés, comme les sites Web Reddit et Wikipedia, ainsi que les éditeurs de nouvelles et de livres, doivent réfléchir sérieusement à la manière dont leurs données sont utilisées. Selena Deckelmann de la Wikimedia Foundation partage cette préoccupation, tout en espérant que les gens continueront de contribuer, surtout face à l’augmentation des contenus de faible qualité générés automatiquement.

L’Angleterre choque la communauté scientifique avec une utilisation nouvelle et insolite du charbon

Cet article explore la complexité des défis auxquels l’IA est confrontée avec l’épuisement potentiel des données textuelles. Le besoin croissant de données pour entraîner des modèles linguistiques sophistiqués pourrait bientôt se heurter à un mur, forçant l’industrie à innover ou à recourir à des mesures moins éthiques pour continuer à progresser.

Source : Cornell University

Tags
ChatGPT

Article précédent

Automobilistes : Avez-vous vraiment le droit de doubler un tracteur ? La réponse ne va pas forcément vous faire plaisir

Article suivant

Automobilistes attention ! Vous allez devoir changer de carte grise comme 1,6 million de foyers en

Autres articles

ChatGPT bientôt en panne sêche face à la pénurie de textes « écrits par des humains » 3c5h63

La course contre la montre pour les données 69ii

Se tourner vers des sources alternatives 5o41

Le dilemme à long terme 3p6o4z

Défis et solutions possibles 1j2542

Renforcer l’utilisation des données existantes 4a4dl

Perspectives d’experts extérieurs 5xv60

Réflexion sur les données créées par l’homme 6h5c4k

Top Infos 3u18s

ChatGPT gratuit en 2025 : toutes les astuces pour utiliser l’IA sans payer 152t5c

Qu’est-ce qu’une attestation d’assurance responsabilité civile ? 5n2v4w

Assurance auto : Les précautions essentielles avant de choisir votre couverture 2k5z4q

Cauchemar sur roues : L’expérience terrifiante d’un propriétaire de Cybertruck force Elon Musk à agir 24t4z

Une aide colossale de 1,5 milliard d’euros pour le Biométhane en 6w3x6u

Coups de cœur 6h286u

My Hero Academia – C’est pourquoi Overhaul porte un masque 3f5z5

Kim Kardashian est presque méconnaissable avec des sourcils et des cheveux blonds u4p43

Snapchat déploie de nouveaux Bitmojis pour célébrer la Journée mondiale de l’environnement 2021 5x1t3x

Actualités s6k1y

ChatGPT gratuit en 2025 : toutes les astuces pour utiliser l’IA sans payer 152t5c

Qu’est-ce qu’une attestation d’assurance responsabilité civile ? 5n2v4w

Assurance auto : Les précautions essentielles avant de choisir votre couverture 2k5z4q

Cauchemar sur roues : L’expérience terrifiante d’un propriétaire de Cybertruck force Elon Musk à agir 24t4z

Une aide colossale de 1,5 milliard d’euros pour le Biométhane en 6w3x6u

Jeux vidéo r2o5r

Terminez la prophétie Northern Fallacy dans Tears of the Kingdom et dépoussiérez les bottes Doomrider, voici comment 4y4867

Quête Résoudre les peines des chèvres dans Zelda : Totk – Où sont les chèvres ? 414a2c

One Piece : Le chapitre 1086 de Manga a-t-il présenté le père de Shanks ? La famille Figarland également confirmée dans le manga 3t129

Star Trek : Strange New Worlds – Nouveaux trailers pour le lancement de la saison 2 en juin chez Paramount+ 43702g

Sanctuaire de Kada’unar : terminez le défi des voies navigables dans Zelda Tears of the Kingdom 1p6c4o

Manga 733q39

Black Clover 316: Asta contre Lucifero 6t703b

Blue Exorcist : Ordre de veille pour les séries et les films, Guide de remplissage 4w6d71

Qui est le père d’Izuku Midoriya (Deku)? 24561w

Les yeux de Boruto : le vrai pouvoir de Jougan 3050z

Tout sur la technique de respiration solaire : Tueur de démons 43kz