Dieser Crashkurs ermöglicht Ihnen einen praxisnahen Einstieg in Data Science, mit anschaulichen Erklärungen und zahlreichen Anwendungsbeispielen, unterstützt durch interaktive Elemente. Er richtet sich an alle, die mehr über die Möglichkeiten der Datenanalyse lernen wollen, ohne gleich tief in die Theorie oder bestimmte Methoden einzusteigen. Das Buch geht tief genug, um Vorteile, Nachteile und Risiken zu verstehen, steigt aber dennoch nicht zu tief in die zugrunde liegende Mathematik ein. Es wird nicht nur erklärt, wofür wichtige Begriffe wie Big Data, maschinelles Lernen oder Klassifikation stehen, sondern auch anschaulich mit zahlreichen Beispielen aufgezeigt, wie Daten analysiert werden. Ein breiter Überblick über Analysemethoden vermittelt das nötige Wissen, um in eigenen Projekten geeignete Methoden auszuwählen und anzuwenden, um das gewünschte Ergebnis zu erreichen.
Der benötigte Python-Quelltext, der z.B. zur Durchführung von Analysen oder zur Erstellung von Visualisierungen verwendet wird, ist in Form von Jupyter-Notebooks frei verfügbar.
Da es keine allgemeine Definition für Data Science gibt, klärt der Autor in dieser Leseprobe zunächst gängige Begriffe, die oft in diesem Zusammenhang fallen. Ebenso erläutert er, welche Thematiken zu Data Science gehören und welche Konzepte allgemein als Data Science angesehen werden. Zu den Methoden, um Daten zu verstehen, gehören zweifelsohne Visualisierungen, da wir visuelle Informationen schneller verarbeiten können. Auf diese Werkzeuge zur Erkundung von Daten geht Teil 2 dieser LP näher ein.
Wer hat's geschrieben?
Dr. Steffen Herbold ist Professor für Methoden und Anwendungen maschinellen Lernens am Institut für Software und Systems Engineering der Technischen Universität Clausthal, wo er die Forschungsgruppe AI Engineering leitet. Zuvor hat er an der Universität Göttingen promoviert und habilitiert und am Karlsruher Institut für Technologie einen Lehrstuhl vertreten. In der Forschung beschäftigt er sich mit der Entwicklung und Qualitätssicherung der Lösung von Problemen durch maschinelles Lernen, z.B. zur effizienteren Softwareentwicklung, der Prognose von Ernteerträgen oder auch der Erkennung von aeroakustischen Geräuschquellen.