Passer au contenu de la page principale

Introduction à l'apprentissage par renforcement

Quoi:
Capsules vidéos
Quand:
3:00 PM, Mercredi 17 Mar 2021 (30 minutes)
Comment:
Une des percées récentes qui a mis l'intelligence artificielle à l'avant-plan de l'actualité est sans aucun doute la performance du programme AlphaGo de DeepMind. En effet, il s'agit du premier programme informatique à battre un joueur de go professionnel (Fan Hui, en 2015). Par la suite, il a aussi vaincu le joueur de go professionnel considéré comme le meilleur de la dernière décennie (Lee Sedol, en 2016).


Dans cette capsule vidéo, nous allons nous concentrer sur une des briques sur lesquelles repose le programme de DeepMind: l'apprentissage par renforcement. Inspiré des modèles cognitifs d'apprentissage par essai et erreur, l'apprentissage par renforcement est étudié depuis plusieurs décennies, mais c'est surtout grâce à son emploi avec succès sur des jeux de plateau qu'il est aussi connu aujourd'hui.

Nous introduirons la notion de processus de décision de Markov, accompagné d'exemples. Puis, nous décrirons les méthodes permettant d'entraîner un agent intelligent par renforcement. Finalement, nous expliquerons comment ces différentes notions ont permis de mettre sur pied un programme tel que AlphaGo.

Conférencier.ère
Université du Québec à Montréal
Professeur
Detail de session
Pour chaque session, permet aux participants d'écrire un court texte de feedback qui sera envoyé à l'organisateur. Ce texte n'est pas envoyé aux présentateurs.
Afin de respecter les règles de gestion des données privées, cette option affiche uniquement les profils des personnes qui ont accepté de partager leur profil publiquement.

Les changements ici affecteront toutes les pages de détails des sessions