Aller au contenu principal

IFT-4201 Apprentissage par renforcement

Outils théoriques expliquant les raisons, les conditions et les garanties de fonctionnement d'un algorithme; formulation d'un problème réel (instance d'apprentissage par renforcement interactif); caractérisation empirique des algorithmes; environnements simples (Multi-Armed Bandit) communément utilisés pour aborder des problèmes d'apprentissage par renforcement interactif; algorithmes fondamentaux (Upper Confidence Bound, Thompson Sampling) permettant d'aborder le compromis exploration-exploitation en apprentissage par renforcement; utilisation efficace de l'information structurelle par la régression paramétrique ou non et par les réseaux de neurones; variantes dans les dynamiques des environnements et applications associées, y compris l'optimisation bayésienne; prise de décision séquentielle dans les processus de décision markoviens (MDP).

  • 3 Crédits

  • Cycle du cours

    • Premier cycle
  • Modes d'enseignement

    • Régulier
  • Cours pouvant être offert à distance
  • Cours pouvant être offert en formule hybride

Responsables

  • Faculté des sciences et de génie
  • Département d'informatique et de génie logiciel

Préalables

(GLO-2100 OU IFT-2008) ET (MAT-1200 OU MAT-2930 OU PHY-1001) ET (IFT-4102* OU GIF-4101*)

* Indique un préalable qui peut être suivi simultanément.

Cours équivalents ou jumelés ULaval

Les cours équivalents sont des activités de même cycle dont le contenu est identique ou très semblable. La réussite de l'un entraîne la reconnaissance de l'autre. Si, à l’une des sessions indiquées, vous avez réussi un cours équivalent, vous n’avez pas à vous inscrire au cours présenté sur cette page. Le cours équivalent vous sera reconnu.

Les cours jumelés sont des activités de cycles différents. Si vous avez suivi un cours de 1er cycle de niveau 4000, vous ne pouvez pas suivre le cours correspondant de niveau 6000 ou 7000 si vous poursuivez des études au 2e ou au 3e cycle et vous ne pouvez pas demander à la direction de votre programme de le reconnaître.

Cette page constitue la description officielle de cette activité. L'Université Laval se réserve le droit de modifier l'activité sans préavis. Tous les horaires indiqués sont sujets à changement.

Répartition hebdomadaire

  • 3h Cours
  • 0h Laboratoire ou travaux pratiques
  • 6h Travail personnel
  • 9h Total

Horaire

Pour vous inscrire, accédez à monPortail.

Automne 2023 – 1 section offerte

NRC 85775 Capacité maximale: 3 étudiants

La formation hybride combine, en proportion variable, des activités de formation offertes en présence physique des étudiants et de l’enseignant ainsi que des activités de formation à distance. La partie en ligne du cours se déroule sur monPortail. La partie en présentiel se déroule sur le campus de l’Université Laval à des jours, heures et locaux déterminés. Plus de détails seront fournis sur le plan de cours.

Plages horaires

    • Type: Sur Internet
    • Dates: Du 5 sept. 2023 au 15 déc. 2023
    • Type: En classe
    • Dates: Du 5 sept. 2023 au 15 déc. 2023
    • Journée: Jeudi
    • Horaire: De 9h30 à 12h20
    • Pavillon: Adrien-Pouliot
    • Local: 2573

Automne 2022 – 1 section offerte

NRC 85843 Capacité maximale: 10 étudiants

Ce cours est offert à distance en mode synchrone, en direct, selon l’horaire indiqué. Les enregistrements des séances seront rendus disponibles sur le site Web du cours. Les étudiants inscrits à cette section recevront un courriel à leur adresse « ulaval.ca » mentionnant la procédure à suivre pour leur permettre de suivre le cours en direct sur internet ou d’écouter les enregistrements des cours précédents. NOTE IMPORTANTE : Pour chaque cours donné à distance, veuillez vous assurer qu’il n’existe aucun conflit d’horaire entre vos examens. Aucun accommodement ne sera accordé en cas de conflit d’horaire.

Plage horaire

    • Type: Classe virtuelle synchrone
    • Dates: Du 6 sept. 2022 au 16 déc. 2022
    • Journée: Jeudi
    • Horaire: De 9h30 à 12h20