Pour rester au top, les intelligences artificielles doivent sans cesse être formées à partir de nouvelles données. Sans cela, elles risquent de devenir obsolètes et de se dépasser par la concurrence. Mais qu’adviendra-t-il quand elles n’auront plus rien à ingurgiter ?
L’essentiel : sans nouvelles ressources à se mettre sous la dent, les IA pourraient très prochainement ressasser les mêmes idées.
Zoom arrière : c’est grâce aux immenses quantités de données que les IA parviennent à donner l’illusion qu’elles sont dotées de créativité. Car en réalité, elles ne font qu’adapter aux requêtes qui lui sont transmises des schémas de réflexion tirés de ces données.
- ChatGPT, par exemple, a été formé à l’aide de 570 gigaoctets de données, soit environ 300 milliards de mots.
Zoom avant : les IA vont rapidement arriver au bout de toutes les données disponibles, mettent en garde un groupe de chercheurs.
- Une situation qui n’a rien à voir avec le fait que certaines entreprises se réservent l’exclusivité de certaines données, notamment Musk avec X. Même si cela joue dans la balance.
- Les grands ensembles de données sont simplement une ressource limitée, surtout ceux de qualité.
- Les publications sur les réseaux sociaux sont des données, mais peu qualitatives en raison des biais et des fake news qu’elles véhiculent.
- Les prévisions les plus alarmistes font état d’une pénurie à l’horizon 2026, surtout si les tendances actuelles en matière de formation d’IA se poursuivent.
- À noter que les données de faible qualité – provenant des réseaux sociaux, notamment – seront épuisées entre 2030 et 2050.
- Pour les données d’image de données qualité, ils évoquent 2030 à 2060.
Un risque pour le marché
Sans nouvelles données à se mettre sous la dent, les algorithmes des IA ne pourront plus s’entrainer et produiront des résultats inexacts ou de mauvaises qualités.
- Un risque connu des développeurs qui tentent de trouver des solutions.
- Et générer de nouvelles données grâce à des chatbots n’est pas forcément la meilleure solution, du moins pour le moment.
- Cette technique a déjà été explorée et a rapidement montré ses limites. Entrainées avec des bases de données générées artificiellement, les IA donnent des résultats « confus et inquiétants ».
- Le leader du marché, OpenAI, à l’origine de ChatGPT, a déjà lancé un appel à l’aide. Il demande aux collectivités et autres organismes détenteurs de grandes quantités de données de les partager.
En résumé : toute l’industrie de l’IA pourrait se retrouver à court de nouvelles données pour alimenter leur modèle, de sorte que le marché pourrait connaitre un ralentissement aussi brusque que fut l’explosion de sa popularité en 2023. Cela pourrait même changer la trajectoire de la révolution de l’IA, note The Conversation.
Il reste de l’espoir
L’intelligence artificielle pourrait cependant nous réserver bien des surprises et parvenir à résoudre ce problème d’elle-même. On peut d’ailleurs imaginer que l’exploitation des données disponibles actuellement sera améliorée, de sorte qu’elles pourraient continuer à alimenter les IA durant un long moment encore.