Da Kurse und Bücher über die Grundlagen der Statistik selten aus der Sicht von Data Scientists behandeln, liefert Ihnen dieses Praxisbuch zahlreiche Beispiele in Python und R, wie Sie verschiedene statistische Methoden speziell in den Datenwissenschaften anwenden.
So vermeiden Sie den falschen Gebrauch statistischer Verfahren und erfahren, welche statistischen Konzepte für Datenwissenschaftler besonders relevant sind. Wenn Sie mit R oder Python vertraut sind, ermöglicht Ihnen diese gut lesbare Referenz ein tieferes Verständnis Ihrer Daten und Sie werden Ihr Statistikwissen für die Praxis deutlich ausbauen.
In diesem Buch erfahren Sie
- warum die explorative Datenanalyse ein wichtiger vorbereitender Arbeitsschritt in der Datenwissenschaft ist
- wie Zufallsstichproben Verzerrungen reduzieren und einen qualitativ hochwertigeren Datensatz liefern
- wie Sie mit den Prinzipien des experimentellen Designs eindeutige Antworten auf Ihre Forschungsfragen erhalten
- wie Sie eine Regression verwenden, um Prognosen zu treffen oder Anomalien zu erkennen
- auf welche Weise statistische Methoden aus dem Bereich des Machine Learning es ermöglichen, aus Daten zu lernen
- wie Sie Unsupervised Learning nutzen, um Erkenntnisse aus ungelabelten Daten zu gewinnen
"Dieses Buch stellt die Verbindung her zwischen nützlichen statistischen Prinzipien und der heutigen Praxis des Data Mining. Eine hervorragende Referenz sowohl für Data-Science-Einsteiger als auch für Fortgeschrittene"
Autor der Bestseller-Reihe Data Mining for Business Analytics und Professor an der National Tsing Hua University, Taiwan

Wer hat's geschrieben?
Peter Bruce ist Gründer des Institute far Statistics Educatian bei Statistics.com, das ca. hundert Kurse in Statistik anbietet, von denen sich ein Drittel an Data Scientists richtet. Durch die Rekrutierung von Top-Autoren als Dozenten und die Entwicklung einer Marketingstrategie, die sich insbesondere an professionelle Data Scientists richtet, verfügt er über eine breite Sicht auf den Zielmarkt und hat dabei seine eigene Expertise entwickelt, um diesen zu erreichen.
Andrew Bruce hat über 30 Jahre Erfahrung in Statistik und Data Science in der akademischen Welt, der Verwaltung und der Wirtschaft. Er hat einen Doktortitel in Statistik von der University of Washington und hat zahlreiche Arbeiten in Fachzeitschriften veröffentlicht. Er hat statistikbasierte Lösungen für eine Vielzahl von Problemen entwickelt, mit denen zahlreiche Branchen konfrontiert sind, von etablierten Finanzunternehmen bis hin zu Internet-Startups, und er verfügt über ein tiefes Verständnis für die Praxis der Data Science.
Peter Gedeck hat über 30 Jahre Erfahrung in wissenschaftlichem Computing und Data Science. Nach 20 Jahren als Computational Chemist bei Novartis arbeitet er nun als Senior Data Scientist bei Collaborative Drug Discovery. Er ist spezialisiert auf die Entwicklung von Algorithmen des Machine Learnings zur Vorhersage biologischer und physikalisch-chemischer Eigenschaften von Arzneimittelkandidaten. Er ist Mitautor des Buches Data Mining far Business Analytics (Wiley). An der Universität Erlangen-Nürnberg hat er in Chemie promoviert, an der Fernuniversität Hagen Mathematik studiert.

