Deep Reinforcement Learning-Agenten lernen wie wir Menschen, sie nehmen Rohdaten wie z.B. Sensoreingaben auf und verbessern ihre Reaktionen und Vorhersagen durch Versuch und Irrtum. So können sich KI-Systeme mit Deep Reinforcement Learning schnell an neue Umgebungen anpassen, was eine enorme Verbesserung gegenüber dem Einsatz von neuronalen Standardnetzen ist.
Mit diesem Buch lernen Sie die grundlegenden Konzepte und die Terminologie des Deep Reinforcement Learning sowie die praktischen Fertigkeiten und Techniken, die Sie benötigen, um DRL in Ihren eigenen Projekten einzusetzen.
Jedes Kapitel konzentriert sich auf ein Hauptprojekt, welches das jeweilige Thema oder Konzept veranschaulicht. In Beispielen wie Gridworld, Atari Freeway oder Super Mario Bros. setzen Sie wichtige Klassen von Algorithmen wie Deep Q-Networks und Policy Gradients ein, verwenden Dist-DQN oder auf Neugierde basierendes Lernen. Alle Projekte sind in Python programmiert, wobei Tools wie PyTorch und OpenAI Gym genutzt werden.
Grundkenntnisse in Python und Deep Learning werden für die Arbeit mit dem Buch vorausgesetzt. Alle Projekte lassen sich ohne größere Rechnerressourcen umsetzen.
Aus dem Inhalt
- Reinforcement Learning: Grundlagen
- RL-Probleme modellieren: Markov Decision Process
- Ein Gridworld-Spiel mit PyTorch und Deep Q-Networks aufbauen
- Policy-Gradient-Methoden
- Verteiltes Lernen mit Actor-Critic-Methoden
Hier das ganze Inhaltsverzeichnis lesen.- Evolutionäre Algorithmen als alternative Optimierungsmethode
- Mit Verteilungs-DQN Atari Freeway spielen
- Neugierde-Lernen
- Multi-Agenten-Lernen
- Aufmerksamkeitsmodelle und relationale Modelle
Ein Reinforcement-Learning-Algorithmus interagiert dynamisch mit Daten. Dabei entscheidet er, welche Aktionen durchgeführt werden sollen. In dieser
Leseprobe geben die Autoren eine Einführung in Reinforcement Learning, bei dem im Gegensatz zum Deep Learning nicht bei jedem Schritt bekannt ist, was das Richtige ist. Stattdessen ist nur bekannt, was das letztendliche Ziel ist und welche Dinge man vermeiden sollte.
Wer hat's geschrieben?
Alex Zai arbeitete als Chief Technology Officer bei Codesmith, einem immersiven Coding-Bootcamp, wo er weiterhin als Technical Advisor tätig ist, sowie als Software-Ingenieur bei Uber und als Machine Learning Engineer bei Banjo und Amazon. Darüber hinaus wirkt er am Open-Source Deep-Learning-Framework Apache MXNet mit. Er hat zwei Unternehmen mitbegründet, von denen eines durch Y Combinator gefördert wurde.
Brandon Brown beschäftigte sich von klein auf mit dem Programmieren und arbeitete während des Studiums als Teilzeit-Software-Ingenieur, entschied sich aber schließlich für eine Karriere in der Medizin; nebenbei arbeitete er als Software-Ingenieur im Bereich der Gesundheitstechnologie. Heute ist er Arzt und verfolgt seine Forschungsinteressen im Bereich der Computational Psychiatry, inspiriert durch Deep Reinforcement Learning.