Graphical Data Analysis with R. Von Antony Unwin. 296 Seiten, Boca Raton u.a.: CRC Press, May 2015. ISBN: 9781498715232. Gebunden: £44.99; E-Book (vitalsource): £31.49.
18.10.2015, TR
Das in der hochkarätigen R Series von Taylor & Francis erschienene Buch von Antony Unwin widmet sich der grafischen Datenanalyse. Der Autor, Professor für Rechnerorientierte Statistik und Datenanalyse am Institut für Mathematik der Universität Augsburg, ist seit Jahren international einer der anerkanntesten Experten auf diesem Gebiet, er ist unter anderem auch Mitherausgeber des Standardwerkes Handbook of Data Visualization. Bei dem durchgängig vierfarbigen Buch „Graphical Data Analysis with R“ handelt es sich nicht um eine Einführung in die Grafikmöglichkeiten von R, sondern es geht thematisch von den verschiedenen Aspekten der grafischen Datenanalyse aus und zeigt deren Umsetzung mit der Software. Dabei geht es dem Autor explizit nicht um die Erstellung von Grafiken im Sinne eines „storytelling“, sondern darum, für die vorhandenen Daten möglichst viele Grafiken zu erzeugen, um ihnen so am besten gerecht zu werden. „Mehr ist besser“ könnt man also seine Devise nennen.
Das Buch ist in vierzehn Kapitel untergliedert. Die ersten Kapitel widmen sich, nach einer Definition der grafischen Datenanalyse, der grafischen Exploration kontinuierlicher und kategorialer Variablen sowie deren multivariater Visualisierung. Die nächsten beiden Kapitel erläutern eine Strategie, wie man sich anhand verschiedener Grafiken am besten einen möglichst vollständigen Überblick über einen konkreten Datensatz verschaffen kann und sich über das Vorhandensein und die Struktur von fehlenden Werten sowie Ausreißern ein Bild macht. Dem folgen zwei Kapitel über Vergleiche (unter anderem durch Panel Charts) und die Darstellung von Zeitreihen. In Kapitel 12 werden dann sogenannte „Ensemble Grafiken“ vorgestellt, bei denen innerhalb einer Abbildung nicht wie bei einem Panel gleichartige, sondern zum Beispiel verschiedene Grafiktypen nebeneinander gestellt werden. Diese Abbildungsformen werden anhand einer Reihe von Fallstudien näher erläutert. Zum Schluß werden noch eine Reihe von allgemeinen Tipps gegeben und Optionen, die alle Grafiken betreffen, beschrieben. Alle Kapitel schließen mit einer Übersicht „Main Points“ und einer Reihe von Übungsaufgaben. Zu dem Buch gibt es eine eigene website www.gradaanwr.net, von der die verwendeten Daten und der komplette Quellcode, der ganz überwiegend auf ggplot2
basiert, heruntergeladen werden können.
Die Beispiele zeigen insgesamt das Potential, das R auch im Bereich der grafischen Datenanalyse bietet – wenn es mit einer gehörigen Portion statistischem Verständnis kombiniert sind. Ohne dieses wird man sich in der Fülle der Möglichkeiten verlieren. Für Statistiker und Experten der Datenanalyse ist das Buch ohne Zweifel das neue Referenzwerk zum Thema. Die Präsentation von Daten bleibt einem anderen Bereich vorbehalten. Aber auch darauf hat Antony Unwin an anderer Stelle völlig zu Recht hingewiesen (Infovis and Statistical Graphics: Different Goals, Different Looks).
Taylor & Francis vertreibt derzeit keine eBook-Variante, da der Verlag aktuell seine eCommerce-Plattform umstrukturiert. Statt dessen wird lediglich auf Möglichkeit verwiesen, es bei Amazon oder Apple in deren proprietären Formaten zu erwerben.
Zurück zur Liste | Nächster Buchhinweis
Wiedergabe des Buchumschlags mit freundlicher Genehmigung des Verlags.