Introduction à l'apprentissage par renforcement
Mon statut pour la session
Quoi:
Capsules vidéos
Quand:
3:00 PM, Mercredi 17 Mar 2021
(30 minutes)
Une des percées récentes qui a mis l'intelligence artificielle à l'avant-plan de l'actualité est sans aucun doute la performance du programme AlphaGo de DeepMind. En effet, il s'agit du premier programme informatique à battre un joueur de go professionnel (Fan Hui, en 2015). Par la suite, il a aussi vaincu le joueur de go professionnel considéré comme le meilleur de la dernière décennie (Lee Sedol, en 2016).
Dans cette capsule vidéo, nous allons nous concentrer sur une des briques sur lesquelles repose le programme de DeepMind: l'apprentissage par renforcement. Inspiré des modèles cognitifs d'apprentissage par essai et erreur, l'apprentissage par renforcement est étudié depuis plusieurs décennies, mais c'est surtout grâce à son emploi avec succès sur des jeux de plateau qu'il est aussi connu aujourd'hui.
Nous introduirons la notion de processus de décision de Markov, accompagné d'exemples. Puis, nous décrirons les méthodes permettant d'entraîner un agent intelligent par renforcement. Finalement, nous expliquerons comment ces différentes notions ont permis de mettre sur pied un programme tel que AlphaGo.
- Capsules vidéos
- Diapositives
- Je serai disponible de 15h00 à 15h30 sur Zoom