Stosunek atramentu do danych i tła wydruku

17

Zauważyłem, że wiele „supernowoczesnych” pakietów i motywów do kreślenia oraz wielu wybitnych ludzi z danych używa do swoich wykresów szarego tła. Oto kilka przykładów:

ggplot2:

wprowadź opis zdjęcia tutaj

Fivethirtyeight.com Nate'a Silvera:

wprowadź opis zdjęcia tutaj

Podczas gdy w pierwszym powyższym przykładzie (ggplot2) można argumentować, że użycie szarego tła zmniejsza tusz potrzebny do linii siatki, z pewnością nie jest tak w przypadku drugiego przypadku. Jakie są zalety korzystania z szarego tła, w przeciwieństwie do białego lub przezroczystego?

David D.
źródło
2
Fabuła to podawane danie - szare tło to talerz.
ttnphns
3
@ttnphns Lubię analogię. Hadley Wickham powiedział o tle ggplot: „Szare tło nadaje wykresowi podobny kolor (w sensie typograficznym) do reszty tekstu, zapewniając, że grafika pasuje do przepływu tekstu bez wyskakiwania z jasnym białym tłem Wreszcie, szare tło tworzy ciągłe pole koloru, co zapewnia, że ​​fabuła jest postrzegana jako pojedynczy byt wizualny. ” Usprawiedliwiał również linie siatki na podstawie tego, że można je łatwo „zlikwidować”.
Silverfish,
1
ttnphns Podoba mi się też twoja analogia. @silverfish tak, dokładnie tak, ze szarą skalą pasującą do mrużącego oczy i porównaj kwadrat działki z tekstem na stronie. Hadley spopularyzował szare tło. Jego projekt z szarym tłem wykresu, ale z białym podparciem (osiami) wyraźnie wskazuje, gdzie dane zaczynają się i kończą. Dane wyłaniają się z większą widocznością niż siatka tła, która działa zgodnie z dobrymi zasadami poznawczymi. Siatka opiera się, dopóki nie będzie trzeba jej użyć do wyszukiwania wartości.
Dianne Cook
3
@Silverfish Spójrz najpierw na Jacquesa Bertina ( Semiologie Graphique ), Alana MacEachrana ( How Maps Work ) i Lee Wilkinson ( The Grammar of Graphics ). MacEachran podaje pełne dane fizjologiczne, psychologiczne i kulturowe z mnóstwem odniesień. Nie zniechęcaj się odniesieniem do „map”: jego książka dotyczy przede wszystkim tego, w jaki sposób ludzie wchodzą w interakcję i generują znaczenie na podstawie grafiki informacyjnej, której mapy są tylko istotnym przykładem.
whuber
2
@silverfish Możliwe, że praca Dan Carra, który zaczął wykorzystywać szare tło i białe linie siatki ze tabelami do kreślenia, działa na początku lat 90. dev.bowdenweb.com/maps/m/using-gray-in-plots.pdf jest źródło pomysłu. Znam Hadleya i przedyskutowałem to. Ale analogią do szarej zezowej skali tekstu jest wyjaśnienie Hadleya.
Dianne Cook

Odpowiedzi:

18

Współczynnik atramentu danych

Ta koncepcja wynika z bardzo wpływowego Edwarda Tufte z Yale University, który opisał ją w Wizualnym wyświetlaniu informacji ilościowych .

Wyróżnia „atrament danych” (który obejmuje punkty, słupki itp., Ale także etykiety tekstowe lub graficzne) od atramentu wymazywalnego (w tym linie siatki, osie, granice, a także informacje zbędne). Współczynnik atramentu danych to po prostu proporcja użytego atramentu, której nie można usunąć.

Trwa dyskusja na temat tego, w jaki sposób te zasady atramentu danych mogą mieć zastosowanie do wizualizacji komputerowych na stronie wymiany stosów UX .

Dlaczego niektórzy eksperci wolą szare tło?

Hadley Wickham uzasadnił swój wybór domyślnego tła w swojej książce na ggplot2:

Szare tło nadaje działce podobny kolor (w sensie typograficznym) do pozostałej części tekstu, zapewniając dopasowanie grafiki do przepływu tekstu bez wyskakiwania na jasnym białym tle. Wreszcie, szare tło tworzy ciągłe pole koloru, co zapewnia, że ​​fabuła jest postrzegana jako pojedynczy byt wizualny.

Wydaje się, że zasadą jest powstrzymanie go przed „wyskakiwaniem” na widza na wydrukowanej stronie i zapewnienie wizualnej jedności. Osobiście lubię też zmniejszone olśnienie ekranu.

Usprawiedliwił również białe linie siatki na podstawie tego, że można je łatwo „dostroić”. Zgadzam się z Dianne Cook w komentarzach, że dzięki temu dane wyróżniają się powyżej linii siatki, zmniejszając bałagan wizualny. Białe linie siatki są jedną z zalet nieco ciemniejszego tła - co ciekawe, Tufte generalnie unika linii siatki tam, gdzie nie są one konieczne (nie liczą się jako „atrament danych”), ale na niektórych szarych wykresach słupkowych nakłada białe linie siatki. Pod pewnymi względami jest to podobny efekt ggplot2, ale w rzeczywistości umieszcza linie siatki na pierwszym planie , nadając słupkom wygląd „pasiasty”. Szczególną wadą tego jest to, że nie widać kolejnej najwyższej linii siatki nad paskiem,

Dlaczego niektórzy eksperci wolą białe tło?

Jednym z najczęściej oglądanych ggplot2wątków w przepełnieniu stosu jest „ Jak zmienić kolor tła? ”, Co sugeruje, że domyślna nie jest powszechnie popularna.

Kolor elementu może wyglądać zupełnie inaczej w zależności od koloru tła, na którym jest wyświetlany. Tufte tak naprawdę omawia to w rozdziale 5 „Kolor i informacja” w swojej książce „ Wizualizacja informacji”, ale nie umieszcza tego w kontekście np. Wykresu rozrzutu. Maureen Stone, ekspert od kolorów i profesor nadzwyczajny na Uniwersytecie Simona Frasera, zdecydowanie zaleca białe tło z różnych powodów, w tym, że większość palet kolorów (w twoich przykładach używanych do oznaczenia gatunku lub podziału) została zaprojektowana z białym tłem (dla drukowanie). Ich właściwości percepcyjne będą się różnić na ciemniejszym tle. Sugeruje, że biel ma przewagę percepcyjną, ponieważ nasza percepcja kolorów jest relatywna do bieli „lokalnej”, więc wizualnie dostępne białe tło może ustabilizować naszą percepcję.

Sugeruje również bardziej praktyczny powód, który znam: użycie białego tła pozwala zoptymalizować wykres pod kątem zarówno elektronicznego wyświetlania, jak i drukowania, zamiast przygotowywać inną wersję do wydruku.

Silverfish
źródło
2
+1 za malowanie (jakby) obie strony wydania. Słyszałem rozumowanie Hadleya, ale nie słyszałem uzasadnienia Stone * Frasera. Dzięki!
Wayne
8

Tak długo, jak tło jest wystarczająco jasne, aby zapewnić dobry kontrast ze znakami danych, jest to głównie kwestia estetyki, czy jest biała, czy jasnoszara. Chociaż kolor tła jest w pewnym sensie „atramentem”, nie sądzę, że logicznie liczy się jako „atrament”. Nie ma proporcjonalnego odwrócenia uwagi od jednolitego pola jasnoszarego.

I odwrotnie, linie siatki liczą się w obu przypadkach jako logiczny „atrament”. Mimo że białe linie siatki nie zużywają atramentu do drukowania, nadal rozbijają tło i tworzą dodatkową obróbkę wizualną. Powiedziałbym, że linie siatki 538 wymagają mniej logicznego atramentu, ponieważ mają mniejszy kontrast.

Xan
źródło
„Powiedziałbym, że linie siatki 538 pobierają mniej logicznego atramentu ...” - Zgadzam się, uważam, że domyślne linie siatki ggplot2 są bardzo rozpraszające. W przykładzie ggplot2 u góry pytania PO, moje oczy przyciągają raczej linie siatki niż dane.
Adrian