Wykonuję wizualizację danych. Każdy układ odniesienia jest reprezentowany przez kwadrat. Aby podstawowe dane były intuicyjnie czytelne, czy długość boku lub kwadratu każdego kwadratu powinna być proporcjonalna do układu odniesienia, który reprezentuje?
16
Odpowiedzi:
Jeśli ty, twórca, nie jesteś pewien, skąd czytelnik będzie wiedział, co to jest?
Krótka odpowiedź: wartość należy powiązać 1: 1 z ilością koloru na stronie . W twoim przykładzie powinna to być powierzchnia. Ale jest coś więcej: musisz także unikać wprowadzających w błąd wskazówek, które mogłyby spowodować, że czytelnik przeczyta go niepoprawnie, i musisz wiedzieć, dlaczego używasz obszaru zamiast długości (np. Wykresy słupkowe), ponieważ ma on prawdziwe zalety i wady.
Po pierwsze, nigdy nie zmieniaj kształtu i długości (tj. Powierzchni), gdy faktycznie zmienna jest powiązana tylko z długością jednego boku. Jeśli X jest dwukrotnością Y, ale Y ma czterokrotnie więcej kolorów na stronie, wprowadzasz czytelników w błąd. Ten rodzaj zniekształceń jest czasem określany jako „ czynnik kłamstwa ” i często jest uważany za celową próbę wprowadzenia w błąd i wyolbrzymienia różnic.
Jeśli używasz obszaru jako miary, zdecydowanie polecam:
Wiedząc, dlaczego używasz obszaru . Używając obszaru zamiast wymiaru liniowego, takiego jak długość, możesz:
Rozważ użycie okręgów dla obszaru, a nie kwadratów, wyśrodkowanych :
Na przykład powyżej trudno jest nie zauważyć kwadratu oznaczonego „5” jako trzy czwarte wysokości kwadratu oznaczonego „10”, więc jest to potencjalnie mylące.
Kręgi nie zapraszają do tego rodzaju porównania: jest to bardziej intuicyjny, natychmiastowy „Ten obiekt typu blob jest znacznie większy niż następny obiekt typu blob”.
Istnieje wiele dowodów, od testów przeprowadzanych przez użytkowników po badania na małą skalę (spróbujemy później wyłapać kilka przykładów), że tego rodzaju intuicyjne porównanie obszarowe może być bardziej angażujące, może obniżyć barierę wejścia do mniej zaangażowanych odbiorców i może pomagają skupić uwagę czytelnika na temacie, a nie na zimnych szczegółach liczb. Jest to jednak kosztem przeszkadzania w analizie opartej na liczbach.
Nie wybieraj między jednym wymiarem (długość lub odległość) a dwuwymiarowym (powierzchnia) ze względów estetycznych: wybieraj między nimi na podstawie odbiorców i przekazu.
Co jest bardziej odpowiednie dla komunikacji: natychmiastowe porównania na poziomie jelit na poziomie „to znacznie większe”, czy też bardziej rozważane porównania numeryczne na poziomie „to około 80% drugiego”?
Czy istnieją praktyczne powody, dla których musisz korzystać z obszaru?
Następnie, gdy wybrałeś ze względów praktycznych , zastosuj estetykę.
źródło
Powiedziałbym obszar. Opcjonalnie kwadrat o boku dwa razy dłuższym pokazuje jako obszar 4 razy większy. Przypadkowi obserwatorzy będą odnosić się do tego obszaru, nawet bez czytania twojej legendy.
Dobrym przykładem jest ten legendarny wykres autorstwa Randall Munroe xkcd :
( ogromna, czytelna wersja )
źródło
Nie jesteśmy tak dobrzy w osądzaniu różnic w powierzchni, jak w długości. Używamy długości jako przybliżenia i dlatego nie doceniamy różnic w obszarach.
Z tego powodu okrąg, który faktycznie ma 2x powierzchnię innego, wydaje się zbyt mały, ponieważ nasz mózg odnosi swoje promienie, które różnią się 1,4-krotnie.
Interesujące są próby pogodzenia tego zjawiska, takie jak Proporcjonalne mapowanie symboli w R , które proponuje percepcyjne skalowanie symboli w celu ściślejszego dopasowania do tego, jak oceniamy długości i obszary.
Oto ryc. 2 z tego artykułu
Osobiście nie mam z tym żadnego doświadczenia i unikam korzystania z obszarów, jeśli wymagane są oceny ilościowe.
Ciekawą styczną jest związek między postrzeganiem objętości a długością. Różnica w ich postrzeganiu jest jeszcze bardziej uderzająca. Można to zilustrować na tym filmie porównującym rozmiary gwiazd .
Gdy dotrzesz do największej gwiazdy, która ma średnicę około 1700x średnicy Słońca, masz wrażenie, że jest ona znacznie większa niż 1700x.
Aby uzyskać bardziej systematyczne spojrzenie na nasz błąd w postrzeganiu różnic w obszarach i długościach, zobacz Crowdsourcing Graficzna percepcja: Używanie mechanicznego turka do oceny projektu wizualizacji autorstwa Jeffrey Heer i Michaela Bostocka.
źródło
Moim zdaniem obszar (D), a nie każda strona (E).
Jeśli używasz boku o długości 2, obszar byłby 4 razy większy od wartości i miałbyś bardzo nakładający się wykres. (MI)
Gdy masz normalny wykres słupkowy (A), dane są liniowe, a oznaczenie słupka jest tylko estetyczne. (B)
W takich przypadkach obszar ponownie jest reprezentatywny dla danych, ponieważ oznaczenie słupków jest takie samo. Możesz mieć pasek 3D, a mimo to jego objętość odpowiada wartości danych (C)
źródło
Tufte poradził sobie z tym szeroko. Widzieć:
Niektóre zasady integralności graficznej:
W twoim przypadku musisz zadać sobie pytanie, czy dane są lepiej reprezentowane przez obraz 2D lub 3D lub linię. Sześcian, kwadrat i linia to nie to samo. To jeden z powodów, dla których wykresy słupkowe 3D tak często wprowadzają w błąd.
źródło