Diese praktische Referenz konzentriert sich genau auf die Themen, die für Sie als praktizierender Machine-Learning-Anwender zur Lösung gängiger Machine-Learning-Probleme interessant sind. Die vielen Codebeispiele zeigen, wie man übliche Probleme in der Praxis mit strukturierten Daten löst.Nutzen Sie diesen wertvollen Leitfaden als Nachschlagewerk und zur Anregung, für eigene Projekte oder als Begleitmaterial für Machine-Learning-Kurse.
Das Buch ist ideal für Data Scientists, Softwareentwickler und Datenanalysten, die Machine Learning praktisch anwenden. Es bietet einen Überblick über den kompletten Machine-Learning-Prozess und stellt Ihnen verschiedene Bibliotheken und Modelle mit ihren jeweiligen Vor- und Nachteilen und Anpassungsmöglichkeiten vor. Die Codebeispiele sind so kompakt und nachvollziehbar, dass Sie sie für Ihre eigenen Projekte verwenden und auch gut anpassen können.
Diese Themen behandelt die Referenz
- Klassifikation veranschaulicht am Titanic-Datensatz
- Datenbereinigung und der Umgang mit fehlenden Daten
- Explorative Datenanalyse
- Typische Vorverarbeitungsschritte
- Auswahl von Merkmalen, die für das Modell relevant sind
Hier das ganze Inhaltsverzeichnis lesen.- Modellauswahl und die Interpretation von Modellen
- Regression mit verschiedenen Machine-Learning-Techniken
- Metriken für die Klassifikations- und Regressionsbewertung
- Clustering und Dimensionsreduktion
- Scikit-learn-Pipelines
Um ein Gespür für eine große Datenmenge zu bekommen, bietet sich die Bibliothek pandas an. Mit pandas lassen sich zusammenfassende Statistiken der Daten erheben. Matt Harrison zeigt in dieser
Leseprobe, wie Sie verschiedenartige Daten veranschaulichen, vom Histogramm über Streu- und Kombidiagramme bis zu parallelen Koordinaten, mit denen sich Cluster multivariater Daten sichtbar machen lassen.
"Matt hat ein ausgeprägtes Verständnis für praktische Herangehensweisen bei der Verwendung der Data-Science-Tools von Python. Ich kann diese Referenz auf jeden Fall als ein Buch empfehlen, das Sie immer zur Hand haben sollten, wenn Sie sich mit strukturierten Daten in Python beschäftigen."
– Chris Moffitt, Practical Business Python, pbpython.com
Wer hat's geschrieben?
Matt Harrison leitet MetaSnake, ein Trainings- und Beratungsunternehmen für Python und Data Science. Er setzt Python seit 2000 in einer Vielzahl von Bereichen ein: Data Science, BI, Speicherung, Testing und Automatisierung, Open-Source-Stack-Management und Finanzen.