Tło:
Wcześniej w Cross Validated mieliśmy pytania dotyczące:
- Jakie są najlepsze praktyki przy przygotowywaniu działek?
- Jakie są dobre porady online na temat kreślenia dwóch zmiennych numerycznych?
@David zasugerował w komentarzach do tego pytania , że powinniśmy mieć pytanie społeczności wiki z jedną regułą wizualizacji na odpowiedź , na którą społeczność mogłaby głosować.
Pytanie
Jakie są podstawowe zasady projektowania i tworzenia graficznych reprezentacji danych?
Zasady
- Jedna zasada na odpowiedź
- Najlepiej dołącz krótkie wyjaśnienie, dlaczego uważasz, że to dobry pomysł
- Preferowane są odpowiedzi z przykładami (kod i obraz) dobrych i złych praktyk.
data-visualization
Jeromy Anglim
źródło
źródło
Pomocna może być znajomość trzech wymiarów koloru. Jeśli używasz kilku kolorów, powinny one idealnie różnić się pod względem kilku z tych wymiarów, a nie tylko jednego.
Wartość. Wykres powinien pozostać czytelny nawet w czerni i bieli. Ta prosta zasada powinna uwzględniać ślepotę kolorów, drukarki niskiej jakości i złe warunki oświetleniowe. Nawet jeśli używasz różnych odcieni, upewnij się, że wartości są wystarczająco różne. W szczególności wykresy powinny być ciemne na jasnym tle (lub na odwrót), ale nie szare na szarym tle. Najgorszym przykładem byłby niebieski wykres na czerwonym tle - oba są wartościami średnimi, tj. Dałyby bardzo podobne szarości po konwersji na czarno-biały.
Nasycenie. Nasycenie należy stosować z umiarem: czysta czerwona linia może być w porządku, ale grubsza, mniej nasycona czerwona linia będzie bardziej czytelna (zwiększona grubość pomaga odróżnić kolory i pozwala zmniejszyć nasycenie). Z drugiej strony bolesny jest czysty czerwony obszar: nie używaj nasyconych kolorów do wypełnienia obszarów. Do palety kolorów Brewer (przeznaczony dla map, a nie linia działki) podać przykłady wyborów kolorystycznych niskim nasyceniu. Najgorszym przykładem byłoby ponownie nasycone tło (niebieski na czerwonym lub czerwony na niebieskim).
Odcień. Jak wspomniano w @gung, unikaj kombinacji czerwony / zielony (sygnalizacja świetlna): jest znacznie więcej osób niewidomych niż myślisz. Zwłaszcza z odcieniem, mniej znaczy więcej. Na przykład, aby wykreślić wartości „rozbieżne” (tj. Wielkości, które mogą być dodatnie lub ujemne), użyj tylko dwóch odcieni (dla wartości dodatnich i ujemnych), aby czytelnik mógł natychmiast rozpoznać, co jest wysokie, a co niskie. Zastosowanie dyskretnego gradientu może dać znacznie czytelniejszy wykres: granice między kolorami stają się widoczne i tworzą wykres konturowy.
Możesz przeczytać praktyczne zasady S. Few dotyczące używania kolorów w tabelach lub zapoznać się z dowolnym materiałem na temat „teorii kolorów” dla studentów sztuki lub projektowania.
źródło
Umieść jak najwięcej wymaganych informacji w samej figurze. Nie wymagaj od czytelnika odwoływania się do podpisu, np. W celu identyfikacji znaczenia różnych symboli lub kolorów. Umieść dowolne informacje (lub informacje uzupełniające), które nie mogą wejść na samą postać w podpisie. Chodzi o to, aby zminimalizować wysiłek wymagany przez przeglądarkę grafów w celu wyodrębnienia odpowiednich informacji - najlepiej: wykres jest zrozumiały, następny najlepszy: wymagane dodatkowe informacje można szybko uzyskać z podpisu, co najgorsze: widz musi uważnie przeczytać całą sekcję wyników szukającą kluczowych szczegółów, aby dowiedzieć się, co się dzieje.
źródło
Spraw, aby fabuła była jak najprostsza. Słowem Tufte „zminimalizuj stosunek atramentu do danych”.
Na przykład unikaj:
źródło
Zostaw czas na edycję. Stworzenie dobrego wykresu wymaga czasu i często (przynajmniej dla mnie) wielu prób.
źródło
Nie sprzeciwiaj się czerwieni i zieleni. Kolor może być pomocny, ale przy korzystaniu z koloru należy zawsze pamiętać, że znaczna mniejszość ludzi jest ślepa na czerwono-zielone kolory. Kiedyś pokazywałem komuś jakieś dane, a on nie mógł zrozumieć, co się dzieje na moich wykresach - to była strata i czułem się dość głupio. Inne formy ślepoty na kolory są bardzo rzadkie, ale czerwono-zielone są dość powszechne. Ta strona ma wiele dobrych informacji. Oto kilka porad:
źródło
Nie używaj skumulowanych wykresów słupkowych. I w powiązanej notatce, jeśli masz element w skali Likerta, nie odczuwaj potrzeby pokazywania proporcji dla każdej odpowiedzi na każdy element. Te wykresy powodują, że moje oczy krwawią.
Nie używaj wykresów kołowych.
Nie powielaj danych zawartych na wykresie, wrzucając do tabeli.
Użyj czcionek bezszeryfowych, takich jak Arial, do tytułów wykresów itp., Ponieważ te typy czcionek zostały zaprojektowane w taki sposób.
Żaden post na temat projektu nie jest kompletny bez odniesienia do książki, naprawdę podoba mi się statystyczna zasada praktyczna . Rozdział 9 jest nieco istotny dla dyskusji tutaj i fragmentów, na które wskazuję, gdy zapytany, dlaczego nienawidzę skumulowanych wykresów słupkowych i kołowych. :)
Spowiedź: w jednej z moich pierwszych ról konsultacyjnych dla małego klienta organizacji pozarządowej dałem im raport zawierający wiele ułożonych wykresów słupkowych, wydrukowanych w kolorze (było to w połowie lat 90.). Myślę, że udało mi się uzyskać żółte, fioletowe i czerwone u tych szczeniąt.
źródło
Nie zadzieraj z osiami. Nie odcinaj pierwszych stu jednostek tylko dlatego, że nachylenie wykresu wygląda bardziej imponująco. Obraz zostanie naklejony, a ludzie zapamiętają znacznie większy efekt niż faktycznie zmierzono.
źródło