Buchhinweis:R Data Visualization Cookbook

Over 80 recipes to analyze data and create stunning visualizations with R. Von Atmajitsinh Gohil. 236 Seiten, Packt Publishing, Januar 2015. ISBN: 9781783989508.


07.04.2015, TR

Das „R Data Visualization Cookbook“ ist nach „R Graphs Cookbook Second Edition“ von Jaynal Abedin und Hrishi V. Mittal und „R Graph Essentials“ von David Alexander Lillis das mittlerweile dritte – innerhalb von weniger als sechs Monaten erschienene – Buch von Packt Publishing, das die Grafikmöglichkeiten von R zum Thema hat. Der Autor Atmajitsinh Gohil betreibt auch ein blog unter der Adresse „datavisualizationineconomics.blogspot.com“, das dort die Überschrift „visualizingeconomics“ trägt: exakt so, wie die schöne und etablierte Website von Catherine Mulbrandon. Aber das nur nebenbei.
Anders als bei den anderen beiden R-Grafik-Büchern des Verlages ist der Ansatz hier etwas weiter: neben R werden gelegentlich noch weitere Programme wie ScapeToad, ArcGIS oder Mapbox herangezogen. Darüber hinaus werden auch interaktive und animierte Techniken behandelt. Der Autor, der sich selbst als Nicht-Programmierer bezeichnet, richtet sein Buch an „Neulinge“, die bislang weder mit R noch mit Visualisierung zu tun hatten. Das Buch beginnt mit einer Einführung in die Grundlagen von R, im zweiten Kapitel wird beispielhaft die Erstellung einiger Base- und interaktiven Grafiken erläutert. Dem folgen Kapitel über Heat Maps und Dendogramme, Karten sowie Kreisdiagramme einschließlich Alternativen. Kapitel 6 widmet sich 3D-Diagrammen, Kapitel 7 höheren Dimensionen, wobei damit eine bunte Mischung aus multivariaten Darstellungsformen, Netzwerkdiagrammen und „Pyramidenplots“ (Rücken-an-Rücken-Balkendiagrammen) gemeint ist. Einem Kapitel über die Darstellung kontinuierlicher Daten folgt noch eines über Textdiagramme, den Schluss des Buches bildet ein Abschnitt „Creating Applications in R“, das die Erstellung animierter Plots, von Präsentationen, dem Auslesen von Daten über eine API-Schnittstelle sowie als Beispiel die Erstellung einer Auswahlbox mit dem web application framework shiny behandelt. Die einzelnen Abschnitte sind dabei stets nach dem gleichen Schema untergliedert (Getting ready, How to do it…, How it works…, There’s more…, See also). Die im Buch verwendeten Daten und Skripte können nach Anmeldung mit einer E-Mail-Adresse als ZIP-Datei von der Website des Verlages heruntergeladen werden. Hierzu muss der Kauf des Buches nicht nachgewiesen werden. Wer sich für den Kauf einer E-Book-Variante oder den Kauf der Kombination (Print- und E-Book) beim Verlag entscheidet, muss sich zunächst mit einer E-Mail-Adresse anmelden. Daraufhin erhält man einen Account, in dem man das E-Book online lesen oder in den Formaten PDF, EPUB oder MOBI jederzeit und mehrfach DRM-frei herunterladen kann. Verfügt man über eine Kindle E-Mail-Adresse, kann man sich das Buch darüber hinaus auf seinen Kindle senden.
Grundsätzlich ist es zu begrüßen, dass ein Buch auch interaktive Grafikmöglichkeiten von R behandelt. Gohil hat sich hierbei für googleVis entschieden. googleVis ist eine von Markus Gesmann und Diego de Castillo entwickelte Schnittstelle, um von R aus mit data frames direkt auf die Google Charts API (jetzt: Google Charts Tools) zuzugreifen. Das Ergebnis sind von R mittels R-Funktionen erzeugte HTML-Dateien, die die aus data frames in JSON-Objekte konvertierten Daten sowie Referenzen auf die von Google bereitgestellten Javascript-Funktionen enthalten (bzw. in manchen Fällen noch Flash). Dabei gibt es für die einzelnen Charttypen von Google Charts jeweils eine R-Funktion, deren Parameter das Aussehen des Charts steuert. Dieser Ansatz hat meiner Ansicht nach Vor- und Nachteile: der Vorteil besteht darin, dass man sich hier eine ausgetüftelte Entwicklung animierter und alles in allem recht gut aussehender Charts in R zunutze machen kann. Nachteilig ist andererseits, dass damit nach base graphics, grid, lattice und ggplot ein weiterer Grafikstil mit eigener Syntax in R eingeführt wird. Da es bislang keine ebenso weitreichenden Alternativen in R gibt, ist die Behandlung von googleVis aber konsequent. Etwas überraschend sind einige Ungenauigkeiten: so liest man, dass googleVis von Google entwickelt worden sei (S. 26; richtig: von Markus Gesman und Diego de Castillo) oder dass „das andere“ interaktive Paket von R GGobi sei (ebda.; richtg: rggobi). Solche Fehler sind erstaunlich, wenn man bedenkt, dass nicht weniger als sechs Reviewer zu Beginn des Buches genannt werden.
Insgesamt hat das Buch bei mir einen durchwachsenden Eindruck hinterlassen. Einerseits ist ein aktueller Überblick über die Datenvisualisierungsmöglichkeiten in R inkklusive interaktiver und animierter Techniken zu begrüßen. Letztendlich wirken die Beispiele aber etwas zusammengewürfelt und beschränken sich oft darauf, ein Paket zu laden, Daten einzulesen und eine Funktion aus dem Paket aufzurufen. Insbesondere für googleVis kann man vielleicht besser auf die außergewöhnlich gute Dokumentation mit mehreren Vignetten und die Anwendungsbeispiele in Markus Gesmans blog zurückgreifen.

Zurück zur Liste | Nächster Buchhinweis

Wiedergabe des Buchumschlags mit freundlicher Genehmigung des Verlags.