Yann LeCun, directeur de l’IA chez Meta et précurseur du Deep Learning

L’intelligence artificielle est l’un des sujets les plus passionnants du moment, et récemment Yann LeCun, AI lead chez Meta, a clairement indiqué que des systèmes comme ChatGPT ne pourront pas surpasser l’intelligence humaine. Connu pour être formé sur d’énormes quantités de textes, LeCun estime que cela ne développera pas une logique avancée ni une compréhension du monde.

Pour ce faire, LeCun propose une approche différente des grands modèles de langage (LLM). Le pari principal de ce chercheur réside dans le “modélisation du monde”. Mais en quoi consiste ce nouveau paradigme de l’IA ?

Tout d’abord, c’est une bonne idée de garder à l’esprit qui est Yann LeCun, puisqu’il ne s’agit pas de n’importe quel chercheur en IA. LeCun est un informaticien qui a reçu en 2018 le prix Turing, la plus haute distinction en informatique, pour ses contributions à l’intelligence artificielle.

De plus, LeCun est l’un des « pères » du L’apprentissage en profondeur tel que nous le connaissons aujourd’hui et était responsable de la modélisation des réseaux de neurones convolutifs (CNN). Les CNN sont aujourd’hui utilisés dans d’innombrables applications, parmi lesquelles se distinguent les véhicules autonomes ou la détection d’objets extragalactiques. En fait, il s’est récemment disputé avec Elon Musk à propos de CNN, puisque le millionnaire controversé estime qu’elles sont déjà inutiles (grosse erreur).

Eh bien, LeCun est une autorité dans le monde de l’IA et l’équipe de développement de Meta et Mark Zuckerberg le savent. C’est pourquoi il dirige actuellement les efforts de l’entreprise pour créer un intelligence artificielle générale (AGI). Les AGI sont des systèmes qui vont au-delà de ce qui a été montré jusqu’à présent par les LLM tels que ChatGPT. En effet, ils cherchent à façonner un agent capable de comprendre, d’apprendre et d’appliquer les connaissances à la manière d’un humain.

Le problème avec les LLM comme GPT, Gemini ou Alphabet est qu’ils sont conditionnés aux informations (généralement juste du texte) avec lesquelles ils sont formés. De cette façon, leurs réponses sont prédéterminées par ce qu’ils ont lu précédemment, que ce soit correct ou non, puisque nous avons vu que les LLM se trompent sur toutes sortes de choses. On peut citer le cas de la colle à pizza qui recommandait d’utiliser l’IA de Google.

Le « façonnage du monde »

Pour surmonter ce conditionnement, LeCun propose le “modélisation du monde” ou modélisation du monde. La clé de la modélisation du monde est la capacité recherchée à développer une compréhension profonde et dynamique de l’environnement physique et social où se trouve l’agent intelligent. Cette approche cherche à imiter l’intelligence des humains et des animaux.

Parmi les nombreuses différences entre la modélisation mondiale et le LLM, il y a non seulement le fait que non seulement les questions seraient répondues sur la base de données déjà existantes (textes sur Internet ou livres), mais que le raisonnement serait développé de manière autonome et efficace. C’est plus ou moins ce qui est recherché pour AGI.

Le fait est qu’ils veulent créer des machines qui apprennent de l’expérience, comme des enfants. De plus, ils auraient une mémoire persistante pour se souvenir des informations pertinentes, de la planification hiérarchique et de la compréhension de la physique du monde. Cependant, LeCun et Meta ne sont pas les seuls prétendants à la modélisation AGI.

Comme il est naturel de le penser, les premiers candidats sont les LLM. OpenAI et Google présentent des améliorations continues de leurs systèmes de génération de texte, faisant même preuve d’un certain degré de raisonnement. DeepMind, quant à lui, s’appuie davantage sur l’apprentissage par renforcement, en utilisant des techniques telles que des environnements simulés et même des jeux vidéo, pour que les agents apprennent à interagir avec leur environnement.

La modélisation du monde sur laquelle Meta parie est une option de plus. Bien que LeCun pense que Cela pourrait nous prendre au moins une décennie pour créer quelque chose de similaire à une AGI., la technologie évolue constamment. Peut-être que dans quelques années nous trouverons le moyen d’accélérer le processus, ou non. Quoi qu’il en soit, 10 ans ne semblent pas si loin de « l’été de l’IA ».