par Luc Coupal et Francois-Alexandre Tremblay
- Visionner sur YouTube: https://youtu.be/2xH1TjVt9I8
- Télécharger les diapositives: une-intuition-sur-rudder-v3-4.pdf (revision 3.4)
Présentation de l'article "RUDDER: Return Decomposition for Delayed Rewards" écrit par Arjona-Medina, J. A. et al. dans le cadre du cours GLO-7030 Apprentissage par réseaux de neurones profonds donné à l'Université Laval, Qc, Canada.