Czy linie siatki i szare tło są wykrojone i czy należy ich używać tylko na zasadzie wyjątku?

26

Wydaje się, że większość autorytetów zgadza się, że ciemne lub w inny sposób wyraźne linie siatki na wykresach są „chartjunk” z dowolnej rozsądnej definicji i odwracają uwagę widza od komunikatu w głównej części wykresu. Więc nie zawracam sobie głowy udzielaniem referencji w tej kwestii.

Podobnie, wszyscy możemy się zgodzić, że nie będzie czasu, że blady linie siatki, aby utworzyć odwołanie do widzowie będą konieczne. Tufte od czasu do czasu argumentował o potrzebie (i stosowaniu) linii siatki, jak wskazano w tym artykule . I zgadzam się z podejściem Hadleya Wickhama w ggplot2, aby takie linie siatki były białe na jasnoszarym tle, kiedy trzeba ich użyć.

Nie jestem jednak pewien, czy takie linie siatki i szare tło powinny być domyślne , tak jak w ggplot2. Na przykład wydaje się, że nie ma powodu, aby szare tło było inaczej niż białe linie siatki w reliefie - co dodatkowo nasuwa pytanie, czy któreś z nich jest potrzebne. Niedawno zacząłem używać ggplot2 do większości moich potrzeb graficznych i myślę, że jest niesamowity, ale podważył moje podejście do grafiki „bez pudełka, bez tła, bez linii siatki”, które wcześniej stosowałem. Kiedyś myślałem, że gridlines=OFFpowinno to być moje domyślne, chyba że istnieje szczególny powód, aby je dodać - w zasadzie podejście zalecane w tym artykule , na przykład.

Oczywiście łatwo jest zdefiniować motyw w ggplot2, aby uniknąć linii siatki i cieniowania tła (i faktycznie zrobiliśmy to w mojej pracy), ale podejście ggplot2 jest tak niesamowite i ogólnie jego domyślne opcje estetyczne są dobre, zastanawiam się, czy Coś mi brakuje.

Byłbym więc wdzięczny za wszelkie odniesienia w tej kwestii. Jestem pewien, że został dobrze przemyślany (na przykład Hadley Wickham przy ustawianiu domyślnych ustawień ggplot2) i jestem bardzo otwarty na wskazanie właściwego kierunku. Najlepsze, co udało mi się znaleźć, to kilka linków w grupie ggplot2 google, ale najbardziej pomocny wygląd Cleveland nie jest dostępny pod podanym linkiem.

Peter Ellis
źródło
7
Osobiście lubię (słabe) linie siatki z oczywistego powodu - aby ułatwić oszacowanie wartości związanych z punktami na wykresie.
mark999
7
Od p. 141 książki Hadleya: „Wciąż widzimy linie siatki, które pomagają w ocenie pozycji (Cleveland, 1993b), ale mają niewielki wpływ wizualny i możemy je łatwo„ dostroić ”. Szare tło nadaje fabule podobny kolor (w sensie typograficznym) do pozostałej części tekstu, zapewniając dopasowanie grafiki do przepływu tekstu bez wyskakiwania na jasnym białym tle. Wreszcie szare tło tworzy ciągłe pole koloru, które zapewnia, że ​​fabuła jest postrzegany jako pojedynczy byt wizualny. ”
mark999
4
Andrew Gelman prowadził wiele blogów na temat infografik w podobnym stylu. Osobiście uważam, że wykresy bez linii odniesienia są tak samo złe jak odważne, rozpraszające siatki. Bardziej stylowe i fajne, ale wciąż zakłócające zrozumienie i naszą zdolność do wnikania w informacje. Nie chodzi o to, by być minimalistycznym, jak gdybyśmy wszyscy byli skandynawskimi projektantami mebli, ale o jasną komunikację, która powinna zawierać subtelne (ale przydatne) linie odniesienia.
Wayne
3
Zauważam, że jest tutaj bardzo dobra dyskusja, ale wszystko w komentarzach - zastanawiam się, w jakim stopniu można podać jedną, autorytatywną odpowiedź - podejrzewam, że to pytanie byłoby najlepsze jako CW, a następnie moglibyśmy się poruszać (i opracowywać ) niektóre z tych dobrych komentarzy w odpowiedzi.
gung - Przywróć Monikę
1
Dodałem odpowiedź opartą na niektórych komentarzach i przekonwertowałem ją na wiki społeczności
Peter Ellis

Odpowiedzi:

15

Jedną z rzeczy, które mogą pomóc w rozwoju debaty, jest uznanie, co sprawia, że ​​ludzie wizualnie odróżniają tło od pierwszego planu, czerpiąc lekcje z kartografii i stosując ją bardziej ogólnie do dowolnej grafiki statystycznej.

Ludzie mogą początkowo myśleć, że kolor jest dobrą wskazówką, czy określony obiekt znajduje się na pierwszym planie, czy w tle, ale tak nie jest. Weźmy na przykład ten przykład poniżej, zaczerpnięty z posta na blogu ESRI, Make Maps People Want To Look At: Pięć podstawowych zasad projektowania kartografii autorstwa Aileen Buckley.

zamieszanie na pierwszym planie

Więc gdybym poprosił cię o podanie liczby (np. Masy lądu), a która ziemi (np. Jednolitej części wód), którą byś wybrał? Podobne zjawisko dzieje się również w przypadku złudzenia optycznego wazonu Rubina .

Niektóre eksperymentalne badania, które pamiętam, czytając w pracy Alana MacEachrena w How Maps Work sugerują, że na powyższych zdjęciach ludzie wybierają jasne i ciemne obszary z równą częstotliwością dla figury (pozornie odcień koloru i nasycenie są używane do określenia postaci z podłoża). Tak więc kolor nie może wewnętrznie rozgraniczać tego, czy tło konkuruje z pierwszym planem w jakiejkolwiek grafice statystycznej, ale inne wskazówki mogą pomóc.

Ludzie często kojarzą figury jako zamknięte obiekty (jest to część powodu, dla którego powyższa mapa jest myląca, ponieważ żadna masa nie jest zamknięta). Sugeruje to ogólnie (niezależnie od koloru tła), że elementy na wykresie powinny mieć wyraźnie określone granice, a elementy na wykresie powinny być ciemniejsze niż tło. Prawdopodobnie wpływa to de facto na tło fabuły na białe, ale posiadanie szarego tła nie jest szkodliwe. Inne aspekty można wykorzystać do rozróżnienia między pierwszym planem a tłem (w blogu ESRI wspomniano o kilku z nich).

Jednym z nich jest znienawidzony cień programu Excel do grafiki ( przykład podany tutaj w tym biuletynie przez Dana Carra na rysunku 2). Chociaż powinno to obejmować zastrzeżenie, że ludzie mogą interpretować atrybuty numeryczne w miejscu cienia zamiast zamierzonego elementu.

Innym jest użycie różnych kolorów / nasycenia dla obrysu elementu na wykresie w porównaniu do wypełnienia wewnętrznego. Przykłady podano poniżej, a lewy okrąg stanowi przykład nieokreślonej granicy.

wypełnienie vs zarys

Te również nie wydają się wyczerpujące. W przypadku wykresów liniowych często wydaje się, że grubsze linie wychodzą na pierwszy plan, podczas gdy cieńsze linie cofają się w tle.

Jest to głównie przeznaczone do refleksji: twoje samokształcenie wydaje się być dość wyczerpujące (i dziękuję ci za niektóre zasoby, które dostarczyłeś!) Nie sądzę, żebym się nie zgadzał z żadnym z dostarczonych przez ciebie zasobów, ale nie jestem pewien, czy nie rozumiem, o czym mówi Hadley, motywując go do domyślnego szarego tła. Ale osobiste preferencje estetyczne dla szarego tła można uwzględnić, upewniając się, że elementy fabuły wysuną się na pierwszy plan (to jest naprawdę ważne). Te lekcje można zastosować również do linii siatki, a jeśli linie siatki pomagają i są dyskretne (tj. W tle), z pewnością nie są one wykrętami.

Andy W.
źródło
5
Nie sądzę, że głównym pytaniem jest rozróżnienie tła i pierwszego planu - myślę, że to całkiem proste. Prawdziwym wyzwaniem jest stworzenie grafiki w taki sposób, aby dokonywanie porównań, którymi jesteś zainteresowany, było tak proste i dokładne, jak to możliwe. Z mojego doświadczenia, linie siatki ułatwiają odczytywanie i porównywanie wartości - chociaż ja nie poprzeć wszelkie formalne eksperymenty.
hadley
@ Hadley, uznałem, że (główne) skargi na szare tło (i linie siatki) polegały na tym, że były natrętne, co sugeruje, że konkurują one o uwagę z faktycznymi elementami danych na wykresie. To sugeruje zamieszanie na pierwszym planie / w tle. Moje założenia również mogą się mylić (być może jest to czysto estetyczny powód, dla którego ludzie je lubią). Rozróżnianie pierwszego planu i tła może być proste, ale nie sądzę, że jest to powszechna wiedza, więc mam nadzieję, że mój post będzie przydatny w tym zakresie.
Andy W
11

Profesor Wickham napisał w książce ggplot2:

„Wciąż widzimy linie siatki, które pomagają w ocenie pozycji (Cleveland, 1993b), ale mają one niewielki wpływ wizualny i możemy je łatwo„ dostroić ”. Szare tło nadaje fabułę podobnego koloru (w sensie typograficznym) ) do pozostałej części tekstu, zapewniając dopasowanie grafiki do przepływu tekstu bez wyskakiwania na jasnym białym tle. Wreszcie szare tło tworzy ciągłe pole koloru, które zapewnia, że ​​fabuła jest postrzegana jako pojedyncza jednostka wizualna ”.

I @Wayne napisał:

„Osobiście uważam, że wykresy bez żadnych linii odniesienia są tak samo złe jak odważne, rozpraszające siatki. Bardziej stylowe i fajne, ale wciąż zakłócające zrozumienie i naszą zdolność do wnikania w informacje. Pomysł nie polega na minimalistycznym, jakbyśmy wszyscy byli skandynawskimi projektantami mebli, ale dla jasnej komunikacji, która powinna zawierać subtelne (ale przydatne) linie odniesienia ”

a @Peter Flom napisał:

Myślę, że słabe linie siatki powinny być domyślne w wykresie rozrzutu; pomagają czytelnikowi; podobnie, puste spacje między słowami i wierszami tekstu pomagają czytelnikowi. Jednak nie lubię szarego tła. Uważam, że to rozprasza. W końcu tekst to zazwyczaj czarny napis na białym tle.

Peter Ellis
źródło
3

Chociaż staram się unikać domyślnego szarego tła, być może jednym z powodów, dla których Hadley poszedł z szarością, jest umożliwienie użytkownikowi użycia większej ilości jasnych, nasyconych kolorów do wyświetlania danych, co może nie wyglądać tak skutecznie na białym tle.

Nova
źródło
Czy miało to być odpowiedzią na pytanie PO, komentarzem wymagającym wyjaśnień od PO lub jednego z respondentów, czy też własnym pytaniem? Użyj tylko pola „Twoja odpowiedź”, aby podać odpowiedzi na pierwotne pytanie. Będziesz mógł komentować w dowolnym miejscu, gdy Twoja reputacja będzie> 50. Jeśli masz nowe pytanie, kliknij szary kolor ASK QUESTION u góry strony i zadaj je tam, a my pomożemy Ci właściwie.
Gung - Przywróć Monikę
2
Właściwie uważam, że stanowi to odpowiedź na pytanie, przynajmniej częściowo: tutaj jest dyskusja na temat tego, czy szare tło stanowi śmieci, i pewne uzasadnienie sugerujące, dlaczego tak nie jest.
Silverfish,
0

Osobiście wolę ciemny motyw light_bw, a nawet theme_minimal, niż domyślny motyw ggplot2 - patrz http://docs.ggplot2.org/current/ggtheme.html .

domyślny motyw

Uważam, że szare tło w domyślnym motywie jest bardzo rozpraszające - moje oczy przyciągają raczej szare bloki niż punkty. Czy zdarza się to komukolwiek innemu? Na przykład na powyższym wykresie zabawek moje oko jest często przyciągane do prawego dolnego rogu (gdzie nie ma punktów danych).

(Czy nie byłoby interesujące oglądać nagrania śledzące osoby oglądające te wątki?)

Osobiście wolę to:

dark-on-light theme_bw

... ale jest to bardzo subiektywne - nie sądzę, że powinna istnieć jedna zasada, którą każdy musi przestrzegać.

Kod dla tych wykresów:

library(ggplot2)

n <- 100
df <- data.frame(x=runif(n, max=10), epsilon=rnorm(n))
df$y <- 2 + df$x - 0.05*df$x^2 + df$epsilon

p1 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       ggtitle("Default Theme"))
ggsave("default_theme_example.png", p1, width=10, height=8)

p2 <- (ggplot(df, aes(x=x, y=y)) +
       geom_point(size=3) +
       theme_bw() +
       theme(panel.border=element_blank()) +
       ggtitle("Custom Theme"))
ggsave("custom_theme_example.png", p2, width=10, height=8)
Adrian
źródło