(To jest naprawdę komentarz, ale ponieważ wymaga ilustracji, musi zostać opublikowany jako odpowiedź).
Ed Tufte przeprojektował wykres pudełkowy w swoim Wizualnym wyświetlaniu informacji ilościowych (s. 125, pierwsze wydanie 1983) właśnie w celu umożliwienia „nieformalnej, eksploracyjnej analizy danych, w której czas pracownika badawczego należy poświęcić na sprawy inne niż rysowanie linii”. Rozszerzyłem (w sposób całkowicie naturalny) jego przeprojektowanie, tak aby uwzględniało odstające rysunki w tym przykładzie, pokazując 70 równoległych wykresów pudełkowych:
Mogę wymyślić kilka sposobów dalszej poprawy tego, ale jest to charakterystyczne dla tego, co można wytworzyć w trakcie eksploracji złożonego zestawu danych: jesteśmy zadowoleni z wizualizacji, które pozwalają nam zobaczyć dane; dobra prezentacja może przyjść później.
Porównaj to z konwencjonalnym odwzorowaniem tych samych danych:
Tufte przedstawia kilka innych przeprojektowań opartych na swojej zasadzie „maksymalizacji współczynnika atramentu danych”. Ich wartość polega na zilustrowaniu, w jaki sposób ta zasada może pomóc nam zaprojektować skuteczną grafikę eksploracyjną. Jak widać, mechanika ich kreślenia polega na znalezieniu dowolnej platformy graficznej, w której można rysować znaczniki punktów i linie.
Beanplots
Prawdopodobnie najfajniejsze wątki, jakie kiedykolwiek powstały, są w zasadzie implementacją wątków skrzypcowych w małych wielokrotnościach. Wykresy skrzypcowe mają ogromną przewagę nad wykresami skrzynkowymi: mogą pokazywać znacznie więcej szczegółów dla rozkładów, które nie są normalne (np. Mogą naprawdę dobrze pokazywać rozkłady bimodalne). Ponieważ są one zwykle oparte na wygładzaniu Gaussa (lub podobnym), nie będą działać naprawdę dobrze dla rozkładów z punktami końcowymi (np. Rozkładów wykładniczych), ale też nie będą rysować pudełkowo.
Beanplots można bardzo łatwo osiągnąć w R - wystarczy zainstalować pakiet beanplot :
Ta
beanplot
funkcja ma mnóstwo opcji , dzięki czemu możesz dostosować ją do swoich potrzeb. Istnieje również sposób wykonywania beanplots w ggplot2 (potrzebujesz najnowszej wersji):źródło
Oto przykładowy kod R na kilka sposobów, aby to zrobić, prawdopodobnie będziesz chciał to rozwinąć (w tym etykiety itp.) I być może zamienić go w funkcję:
źródło