Introduction à l'apprentissage par renforcement

Quoi:

Capsules vidéos

Quand:

3:00 PM, Mercredi 17 Mar 2021 (30 minutes)

Comment:

Une des percées récentes qui a mis l'intelligence artificielle à l'avant-plan de l'actualité est sans aucun doute la performance du programme AlphaGo de DeepMind. En effet, il s'agit du premier programme informatique à battre un joueur de go professionnel (Fan Hui, en 2015). Par la suite, il a aussi vaincu le joueur de go professionnel considéré comme le meilleur de la dernière décennie (Lee Sedol, en 2016).

Dans cette capsule vidéo, nous allons nous concentrer sur une des briques sur lesquelles repose le programme de DeepMind: l'apprentissage par renforcement. Inspiré des modèles cognitifs d'apprentissage par essai et erreur, l'apprentissage par renforcement est étudié depuis plusieurs décennies, mais c'est surtout grâce à son emploi avec succès sur des jeux de plateau qu'il est aussi connu aujourd'hui.

Nous introduirons la notion de processus de décision de Markov, accompagné d'exemples. Puis, nous décrirons les méthodes permettant d'entraîner un agent intelligent par renforcement. Finalement, nous expliquerons comment ces différentes notions ont permis de mettre sur pied un programme tel que AlphaGo.

Capsules vidéos
Diapositives
Je serai disponible de 15h00 à 15h30 sur Zoom

Alexandre Blondin Massé

Conférencier.ère

Université du Québec à Montréal

Professeur

Permettre aux participants d'évaluer les sessions avec un "pouces vers le haut/bas" (thumbs up/thumbs down).

Permettre aux participants d'envoyer un feedback à l'organisateur.

Pour chaque session, permet aux participants d'écrire un court texte de feedback qui sera envoyé à l'organisateur. Ce texte n'est pas envoyé aux présentateurs.

Afficher la liste des personnes dans l'auditoire de chaque session du programme.

Afin de respecter les règles de gestion des données privées, cette option affiche uniquement les profils des personnes qui ont accepté de partager leur profil publiquement.

Permettre aux participants de participer à des discussions en ligne sur les sessions.

Les changements ici affecteront toutes les pages de détails des sessions

Detail de session