Wydaje się, że większość autorytetów zgadza się, że ciemne lub w inny sposób wyraźne linie siatki na wykresach są „chartjunk” z dowolnej rozsądnej definicji i odwracają uwagę widza od komunikatu w głównej części wykresu. Więc nie zawracam sobie głowy udzielaniem referencji w tej kwestii.
Podobnie, wszyscy możemy się zgodzić, że nie będzie czasu, że blady linie siatki, aby utworzyć odwołanie do widzowie będą konieczne. Tufte od czasu do czasu argumentował o potrzebie (i stosowaniu) linii siatki, jak wskazano w tym artykule . I zgadzam się z podejściem Hadleya Wickhama w ggplot2, aby takie linie siatki były białe na jasnoszarym tle, kiedy trzeba ich użyć.
Nie jestem jednak pewien, czy takie linie siatki i szare tło powinny być domyślne , tak jak w ggplot2. Na przykład wydaje się, że nie ma powodu, aby szare tło było inaczej niż białe linie siatki w reliefie - co dodatkowo nasuwa pytanie, czy któreś z nich jest potrzebne. Niedawno zacząłem używać ggplot2 do większości moich potrzeb graficznych i myślę, że jest niesamowity, ale podważył moje podejście do grafiki „bez pudełka, bez tła, bez linii siatki”, które wcześniej stosowałem. Kiedyś myślałem, że gridlines=OFF
powinno to być moje domyślne, chyba że istnieje szczególny powód, aby je dodać - w zasadzie podejście zalecane w tym artykule , na przykład.
Oczywiście łatwo jest zdefiniować motyw w ggplot2, aby uniknąć linii siatki i cieniowania tła (i faktycznie zrobiliśmy to w mojej pracy), ale podejście ggplot2 jest tak niesamowite i ogólnie jego domyślne opcje estetyczne są dobre, zastanawiam się, czy Coś mi brakuje.
Byłbym więc wdzięczny za wszelkie odniesienia w tej kwestii. Jestem pewien, że został dobrze przemyślany (na przykład Hadley Wickham przy ustawianiu domyślnych ustawień ggplot2) i jestem bardzo otwarty na wskazanie właściwego kierunku. Najlepsze, co udało mi się znaleźć, to kilka linków w grupie ggplot2 google, ale najbardziej pomocny wygląd Cleveland nie jest dostępny pod podanym linkiem.
źródło
Odpowiedzi:
Jedną z rzeczy, które mogą pomóc w rozwoju debaty, jest uznanie, co sprawia, że ludzie wizualnie odróżniają tło od pierwszego planu, czerpiąc lekcje z kartografii i stosując ją bardziej ogólnie do dowolnej grafiki statystycznej.
Ludzie mogą początkowo myśleć, że kolor jest dobrą wskazówką, czy określony obiekt znajduje się na pierwszym planie, czy w tle, ale tak nie jest. Weźmy na przykład ten przykład poniżej, zaczerpnięty z posta na blogu ESRI, Make Maps People Want To Look At: Pięć podstawowych zasad projektowania kartografii autorstwa Aileen Buckley.
Więc gdybym poprosił cię o podanie liczby (np. Masy lądu), a która ziemi (np. Jednolitej części wód), którą byś wybrał? Podobne zjawisko dzieje się również w przypadku złudzenia optycznego wazonu Rubina .
Niektóre eksperymentalne badania, które pamiętam, czytając w pracy Alana MacEachrena w How Maps Work sugerują, że na powyższych zdjęciach ludzie wybierają jasne i ciemne obszary z równą częstotliwością dla figury (pozornie odcień koloru i nasycenie są używane do określenia postaci z podłoża). Tak więc kolor nie może wewnętrznie rozgraniczać tego, czy tło konkuruje z pierwszym planem w jakiejkolwiek grafice statystycznej, ale inne wskazówki mogą pomóc.
Ludzie często kojarzą figury jako zamknięte obiekty (jest to część powodu, dla którego powyższa mapa jest myląca, ponieważ żadna masa nie jest zamknięta). Sugeruje to ogólnie (niezależnie od koloru tła), że elementy na wykresie powinny mieć wyraźnie określone granice, a elementy na wykresie powinny być ciemniejsze niż tło. Prawdopodobnie wpływa to de facto na tło fabuły na białe, ale posiadanie szarego tła nie jest szkodliwe. Inne aspekty można wykorzystać do rozróżnienia między pierwszym planem a tłem (w blogu ESRI wspomniano o kilku z nich).
Jednym z nich jest znienawidzony cień programu Excel do grafiki ( przykład podany tutaj w tym biuletynie przez Dana Carra na rysunku 2). Chociaż powinno to obejmować zastrzeżenie, że ludzie mogą interpretować atrybuty numeryczne w miejscu cienia zamiast zamierzonego elementu.
Innym jest użycie różnych kolorów / nasycenia dla obrysu elementu na wykresie w porównaniu do wypełnienia wewnętrznego. Przykłady podano poniżej, a lewy okrąg stanowi przykład nieokreślonej granicy.
Te również nie wydają się wyczerpujące. W przypadku wykresów liniowych często wydaje się, że grubsze linie wychodzą na pierwszy plan, podczas gdy cieńsze linie cofają się w tle.
Jest to głównie przeznaczone do refleksji: twoje samokształcenie wydaje się być dość wyczerpujące (i dziękuję ci za niektóre zasoby, które dostarczyłeś!) Nie sądzę, żebym się nie zgadzał z żadnym z dostarczonych przez ciebie zasobów, ale nie jestem pewien, czy nie rozumiem, o czym mówi Hadley, motywując go do domyślnego szarego tła. Ale osobiste preferencje estetyczne dla szarego tła można uwzględnić, upewniając się, że elementy fabuły wysuną się na pierwszy plan (to jest naprawdę ważne). Te lekcje można zastosować również do linii siatki, a jeśli linie siatki pomagają i są dyskretne (tj. W tle), z pewnością nie są one wykrętami.
źródło
Profesor Wickham napisał w książce ggplot2:
I @Wayne napisał:
a @Peter Flom napisał:
źródło
Chociaż staram się unikać domyślnego szarego tła, być może jednym z powodów, dla których Hadley poszedł z szarością, jest umożliwienie użytkownikowi użycia większej ilości jasnych, nasyconych kolorów do wyświetlania danych, co może nie wyglądać tak skutecznie na białym tle.
źródło
ASK QUESTION
u góry strony i zadaj je tam, a my pomożemy Ci właściwie.Osobiście wolę ciemny motyw light_bw, a nawet theme_minimal, niż domyślny motyw ggplot2 - patrz http://docs.ggplot2.org/current/ggtheme.html .
Uważam, że szare tło w domyślnym motywie jest bardzo rozpraszające - moje oczy przyciągają raczej szare bloki niż punkty. Czy zdarza się to komukolwiek innemu? Na przykład na powyższym wykresie zabawek moje oko jest często przyciągane do prawego dolnego rogu (gdzie nie ma punktów danych).
(Czy nie byłoby interesujące oglądać nagrania śledzące osoby oglądające te wątki?)
Osobiście wolę to:
... ale jest to bardzo subiektywne - nie sądzę, że powinna istnieć jedna zasada, którą każdy musi przestrzegać.
Kod dla tych wykresów:
źródło