Cursusaanbod

Inleiding tot Reinforcement Learning

  • Wat is reinforcement learning?
  • Sleutelbegrippen: agent, omgeving, toestanden, acties en beloningen
  • Uitdagingen bij reinforcement learning

Exploratie en exploitatie

  • Evenwicht tussen exploratie en exploitatie in RL-modellen
  • Exploratiestrategieën: epsilon-greedy, softmax en meer

Q-learning en diepe Q-netwerken (DQN's)

  • Inleiding tot Q-learning
  • DQN's implementeren met behulp van TensorFlow
  • Q-learning optimaliseren met experience replay en doelnetwerken

Op beleid gebaseerde methoden

  • Algoritmen voor beleidsverloop
  • STRONGE-algoritme en de implementatie ervan
  • Actor-criticus methoden

Werken met OpenAI Gym

  • Omgevingen instellen in OpenAI Gym
  • Agents simuleren in dynamische omgevingen
  • Evaluatie van de prestaties van medewerkers

Geavanceerde Reinforcement Learning technieken

  • Multi-agent versterking leren
  • Diepe deterministische beleidsgradiënt (DDPG)
  • Optimalisatie van proximaal beleid (PPO)

Reinforcement Learning modellen implementeren

  • Real-world toepassingen van reinforcement learning
  • Integratie van RL-modellen in productieomgevingen

Samenvatting en volgende stappen

Vereisten

  • Ervaring met Python programmeren
  • Basiskennis van concepten voor deep learning en machine learning
  • Kennis van algoritmen en wiskundige concepten die worden gebruikt bij reinforcement learning

Audiëntie

  • Datawetenschappers
  • Beoefenaars van machine learning
  • AI-onderzoekers
 28 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (4)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën