Passer au contenu de la page principale

Introduction à l'apprentissage par renforcement

Mon statut pour la session

Quoi:
Capsules vidéos
Quand:
3:00 PM, Mercredi 17 Mar 2021 (30 minutes)
Une des percées récentes qui a mis l'intelligence artificielle à l'avant-plan de l'actualité est sans aucun doute la performance du programme AlphaGo de DeepMind. En effet, il s'agit du premier programme informatique à battre un joueur de go professionnel (Fan Hui, en 2015). Par la suite, il a aussi vaincu le joueur de go professionnel considéré comme le meilleur de la dernière décennie (Lee Sedol, en 2016).


Dans cette capsule vidéo, nous allons nous concentrer sur une des briques sur lesquelles repose le programme de DeepMind: l'apprentissage par renforcement. Inspiré des modèles cognitifs d'apprentissage par essai et erreur, l'apprentissage par renforcement est étudié depuis plusieurs décennies, mais c'est surtout grâce à son emploi avec succès sur des jeux de plateau qu'il est aussi connu aujourd'hui.

Nous introduirons la notion de processus de décision de Markov, accompagné d'exemples. Puis, nous décrirons les méthodes permettant d'entraîner un agent intelligent par renforcement. Finalement, nous expliquerons comment ces différentes notions ont permis de mettre sur pied un programme tel que AlphaGo.

Alexandre Blondin Massé

Conférencier.ère

Mon statut pour la session

Detail de session
Pour chaque session, permet aux participants d'écrire un court texte de feedback qui sera envoyé à l'organisateur. Ce texte n'est pas envoyé aux présentateurs.
Une fois activée, vous pouvez choisir d'afficher la liste des participants pour chaque session. Seuls les participants ayant accepté de rendre leur profil public seront affichés.
Activez cette option pour afficher la liste des participants sur la page de cette session. Ce paramètre s'applique uniquement à cette session.

Les modifications effectuées ici affecteront toutes les pages de détails des sessions sauf indication contraire