Lerne R ohne Programmiervorkenntnisse im Selbststudium anhand einfacher Erklärungen mit Beispielen aus der Praxis und interaktiver Übungen. Die am häufigsten verwendete Statistikprogrammiersprache R wird in den meisten wissenschaftlichen Fachrichtungen und in diversen Unternehmen verwendet. Nach Durcharbeiten dieses Buches können sämtliche Problemstellungen der Datenanalyse gelöst werden, einschließlich
- Datensätze einlesen und bereinigen,
- komplexe Abbildungen erstellen,
- deskriptive und induktive Statistik anwenden und
- Ergebnisse in Word, als PDF oder als Website exportieren.
Veröffentlicht ist das Buch unter der Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International Lizenz und das begleitende R Package remp unter der GPL-3 Lizenz.
Inhaltsverzeichnis
- Einleitung: Aufbau des Buches, ergänzende Literatur.
- Startvoraussetzungen: Installation von R, RStudio und Packages.
- R Projekte: Relative Pfade, Projekte in RStudio erstellen.
- Wichtiges Grundlagenwissen: Variablen, Datentypen, Dollar-Operator.
- Datensätze: Einlesen von R, Excel, SPSS und csv Dateien.
- Datenvorbereitung: Datensätze aufbereiten, Spalten hinzufügen, Funktionen erstellen u.v.m.
- Deskriptive Statistik: Lage- und Streuungsmaße, Häufigkeiten, Zusammenhangsmaße.
- Visualisierungen: Abbildungen publikationsreif erstellen und anpassen.
- Inferenzstatistik: Klassische statistische Modelle aufstellen.
- Ergebnisse exportieren: Tabellen und Berichte in Word, PDF und HTML.
- Datenstrukturen: Vektor, Matrix, data.frame, tibble, Liste, Objektorientierung.
- Funktionen wiederholt anwenden: Listenbasiertes Rechnen, for-Schleifen, einnisten.
Begleitendes R Package remp
Das remp
Package enthält Datensätze, Funktionen und Übungen auf die im Laufe des Buches immer wieder zurückgegriffen wird. Die enthaltenen Features können im Reiter Dokumentation in der Navigationsleiste eingesehen werden. Die Installation erfolgt mithilfe des remotes
Packages.
Detaillierte Installationsanweisungen von R, RStudio und den notwendigen Packages sind im Buch enthalten.
FAQ
-
Welche Zielgruppe hat dieses Buch?
WissenschaftlerInnen und StudentInnen der Fachrichtungen Medizin, Psychologie, Betriebswirtschaftslehre, Wirtschaftswissenschaften, soziale Arbeit, Pharmazie, Agrarwissenschaften, Neurowissenschaften, Biologie, Journalismus, Tourismus, Data Science, Biostatistik und allen weiteren Disziplinen, die Daten auswerten möchten.
-
Was ist R und wieso sollte ich es lernen?
R ist eine Statistikprogrammiersprache, die unter einer Open Source Lizenz kostenlos verfügbar ist. Durch eine große Community gibt es heute für jeden Anwendungsbereich die passenden Erweiterungen. In den letzten Jahren war daher ein Wechsel von kostenpflichtigen Programmen wie Matlab, SAS, SPSS oder Stata zu R erkennbar. Denn wer nicht mehrere tausend Euro zahlt, konnte die Auswertungen dieser Programme nicht nachvollziehen. Sowohl in der Forschung als auch in vielen Bereichen der freien Wirtschaft profitiert man mit R Kenntnissen. Eine sinnvolle Alternative stellt nur Python dar, welches aber bedeutend schwieriger zu erlernen ist und im Kontext der reinen Datenanalyse keinen Vorteil bietet.
-
Ist R einfach zu lernen und kann ich es mir selbst beibringen?
Da R als Programmiersprache speziell für die statistische Datenanalyse entwickelt wurde, ist das Erlernen deutlich einfacher als andere Programmiersprachen. Das hängt vor allem auch mit der einfachen Benutzeroberfläche durch RStudio und die gut integrierten Erweiterungen zusammen. Essentiell beim Selbststudium einer Programmiersprache ist das selbstständige Anwenden entweder der enthaltenen Übungen oder auf eigene Projekte. Wenn man ein Programmierbuch durchliest, ohne eine Übung zu machen, ist man hinterher nicht viel schlauer als vorher. Ähnlich wie man keine Sprache lernen kann, wenn man diese nie mit anderen spricht.
-
Wird alles abgedeckt, was man zur Datenanalyse benötigt?
Ja, nach Durcharbeiten dieses Buches können grundlegende sowie fortgeschrittene Probleme der Datenauswertung selbstständig mit R gelöst werden.
-
Sollte man Vorwissen in Statistik haben?
Ja, aber zum grundlegenden Bearbeiten des Buches wird kein Statistikwissen vorausgesetzt. Um die vorgestellten Funktionen der deskriptiven und induktiven Statistik allerdings sinnvoll anwenden zu können, sollte ein fundiertes statistisches und methodisches Verständnis vorliegen. Ergänzende Literatur zum Erlernen des zugehörigen Statistikwissens ist im Buch angegeben.
-
Gibt es eine gebundene Version zu kaufen?
Nein, derzeit ist das Buch noch nicht in Papierform erhältlich, allerdings ist eine gebundene Veröffentlichung in Planung. Genaue Details folgen.
-
Können die Inhalte heruntergeladen werden?
Nein, offline wird das Buch voraussichtlich nur in gebundener Form und nicht als e-book oder PDF angeboten werden.