Beschreibung
Der ideale Einstieg in Data Science für Praktiker! Ob mit oder ohne Mathematikkenntnisse - Sie bekommen hier den Rundumblick, den Sie für Ihre Projekte brauchen. So heben Sie den Schatz, den Daten darstellen können, wenn man sie richtig befragt. Sie lernen die einschlägigen Analysemethoden kennen, bekommen eine Einführung in die Programmiersprache R und erfahren, wie Sie maschinelles Lernen einsetzen. Und zwar inklusive dazugehöriger Werkzeuge wie Notebooks, die die Data-Science-Programmierung heutzutage so zugänglich machen.Und weil es mit der Technik allein nicht getan ist, geht das Buch auch auf Probleme der Projektdurchführung ein, beleuchtet verschiedene Anwendungsfelder und vergisst auch nicht, ethische Aspekte anzusprechen.Mit vielen Beispielen, Hinweisen für den Fehlerfall, Entscheidungshilfen und weiteren Praxistipps. Aus dem Inhalt: Erste Schritte mit R und RStudioGrundbegriffe der StatistikVorbereitung: Daten reinigen und transformierenk-Means ClusteringLineare und nichtlineare RegressionVorhersagen, Clustering, KlassifizierungTipps und Werkzeuge für alle ProjektphasenIhre Anwendung als REST-API bereitstellenKI und Maschinelles Lernen einsetzenAnomalieerkennung, Warenkorbanalyse und viele weitere AnwendungsfälleMachine Learning: Modelle richtig trainieren
Autorenportrait
Tom Alby ist Chief Digital Transformation Officer bei dem Kreditversicherer »Euler Hermes« für Deutschland, Österreich und die Schweiz. Er unterrichtet Datenanalyse als Lehrbeauftragter an der Hochschule für Angewandte Wissenschaften Hamburg (HAW).
Inhalt
1.1 ... Warum dieses Buch? ... 15
1.2 ... Das Zeitalter der Daten -- alles nur ein Hype? ... 16
1.3 ... Warum nun Data Science? ... 17
1.4 ... Warum Data Science mit R? ... 19
1.5 ... Für wen ist dieses Buch? ... 20
1.6 ... Kann man Data Science ohne Mathe lernen? ... 20
1.7 ... Wie Sie dieses Buch verwenden können ... 22
1.8 ... Materialien und Kontakt ... 22
1.9 ... Danksagungen ... 22
2.1 ... Aus der Geschichte lernen -- alles nur ein Hype? ... 25
2.2 ... Begriffsdefinitionen ... 34
3.1 ... Der allgemeine Ablauf eines Data-Science-Projekts ... 39
3.2 ... Business Understanding: Welches Problem soll gelöst werden? ... 43
3.3 ... Grundsätzliche Ansätze im Machine Learning ... 47
3.4 ... Performancemessung ... 49
3.5 ... Kommunikation mit Stakeholdern ... 57
3.6 ... Aus dem Labor in die Welt: Data-Science-Applikationen in Produktion ... 58
3.7 ... Die verschiedenen Rollen in einem Data-Science-Projekt ... 59
4.1 ... R: kostenlos, portierbar und interaktiv ... 67
4.2 ... Installation und Konfiguration von R und RStudio ... 74
4.3 ... Erste Schritte mit R ... 89
5.1 ... Daten: Sammlung, Reinigung und Transformation ... 112
5.2 ... Notebooks ... 117
5.3 ... Das Tidyverse ... 123
5.4 ... Datenvisualisierung ... 137
5.5 ... Datenanalyse ... 148
6.1 ... Lineare Regression ... 159
6.2 ... Anomalie-Erkennung ... 176
7.1 ... Hierarchisches Clustering ... 185
7.2 ... k-Means ... 197
8.1 ... Anwendungsfälle für eine Klassifikation ... 207
8.2 ... Trainings- und Testdaten erstellen ... 209
8.3 ... Decision Trees ... 217
8.4 ... Support Vector Machines ... 221
8.5 ... Naive Bayes ... 226
8.6 ... XG Boost: Der Newcomer ... 232
8.7 ... Klassifikation von Text ... 238
9.1 ... Warenkorbanalyse -- Association Rules ... 245
9.2 ... k-nearest Neighbours ... 254
10.1 ... Versionierung mit Git ... 267
10.2 ... Mit großen Datenmengen umgehen ... 277
10.3 ... Applikationen via API bereitstellen ... 287
10.4 ... Applikationen erstellen mit Shiny ... 292
11.1 ... Datenschutz ... 307
11.2 ... Ethik: Gegen Profiling und Diskriminierung ... 317
12.1 ... Projekte, Projekte, Projekte ... 325
12.2 ... Wer hilft Ihnen jetzt weiter? ... 329
12.3 ... RSeek ... 335
A ... Typische Fehlermeldungen und geeignete Lösungen ... 339
B ... Glossar ... 343
C ... Literatur ... 347