Czy obszar lub długość kwadratu powinna być proporcjonalna do wizualizowanych danych?

16

Wykonuję wizualizację danych. Każdy układ odniesienia jest reprezentowany przez kwadrat. Aby podstawowe dane były intuicyjnie czytelne, czy długość boku lub kwadratu każdego kwadratu powinna być proporcjonalna do układu odniesienia, który reprezentuje?

dumbledad
źródło
1
Jeszcze nie. Czy to jest szerokie? Miałem nadzieję, że odpowiedź była jednoznaczna (zakładam, że jest to „obszar”), ale ten lud miałby więcej wiedzy na temat projektowania graficznego i psychologii percepcyjnej, aby to poprzeć.
dumbledad
1
IIRC zostało to omówione w niemieckiej książce, którą przeczytałem kiedyś: „So lügt man mit Statistik” en.wikipedia.org/wiki/Walter_Krämer - nie jestem pewien, czy istnieje angielski odpowiednik. TL; DR - zależy od tego, co czytelnicy mają czytać z wizualizacji.
Michael Schumacher
Odpowiedź z pewnością nie jest jednoznaczna. Wszystko zależy od szczegółów - mianowicie, jakie dane prezentujesz, jak prezentujesz i co chcesz komunikować się z tymi danymi.
DA01,
Czy możesz podać przykłady, w których specyfika lub to, co chcemy, aby czytelnicy czytali z wizualizacji, skłoniłoby nas do wyboru, aby długość boku kwadratu była proporcjonalna do układu odniesienia zamiast obszaru kwadratu?
dumbledad
5
+1 Dlaczego każde interesujące pytanie przyciąga co najmniej jeden ścisły głos?!? <
grump

Odpowiedzi:

10

Jeśli ty, twórca, nie jesteś pewien, skąd czytelnik będzie wiedział, co to jest?

Krótka odpowiedź: wartość należy powiązać 1: 1 z ilością koloru na stronie . W twoim przykładzie powinna to być powierzchnia. Ale jest coś więcej: musisz także unikać wprowadzających w błąd wskazówek, które mogłyby spowodować, że czytelnik przeczyta go niepoprawnie, i musisz wiedzieć, dlaczego używasz obszaru zamiast długości (np. Wykresy słupkowe), ponieważ ma on prawdziwe zalety i wady.


Po pierwsze, nigdy nie zmieniaj kształtu i długości (tj. Powierzchni), gdy faktycznie zmienna jest powiązana tylko z długością jednego boku. Jeśli X jest dwukrotnością Y, ale Y ma czterokrotnie więcej kolorów na stronie, wprowadzasz czytelników w błąd. Ten rodzaj zniekształceń jest czasem określany jako „ czynnik kłamstwa ” i często jest uważany za celową próbę wprowadzenia w błąd i wyolbrzymienia różnic.

wprowadź opis zdjęcia tutaj


Jeśli używasz obszaru jako miary, zdecydowanie polecam:

  • Wiedząc, dlaczego używasz obszaru . Używając obszaru zamiast wymiaru liniowego, takiego jak długość, możesz:

    • Poświęć umiejętność wyraźnego dostrzegania różnic matematycznych (nie możesz łatwo powiedzieć „patrz, to dwa razy więcej”)
    • Poproś czytelników, aby oglądali go w intuicyjny, codzienny, nienumeryczny sposób, na przykład w jaki sposób ludzie porównują rozmiary ciast w sklepie. Mniej wyrafinowane, ale bardziej bezpośrednie. Więcej odwagi, mniej głowy.
    • Małe różnice między bardzo podobnymi liczbami stają się prawie niewidoczne.
    • Gdy jedna zmienna jest wiele razy mniejsza od drugiej, bardzo mała nie znika tak źle, jak na wykresie słupkowym, co może pozwolić na większą elastyczność w układach.

wprowadź opis zdjęcia tutaj

  • Rozważ użycie okręgów dla obszaru, a nie kwadratów, wyśrodkowanych :

    • Krąży, ponieważ nie powoduje pomyłek z wykresami słupkowymi i podobnymi. Wysokość i szerokość są mniej ważne: wygląda mniej tak, jakbyś zaprosił porównanie oparte na wysokości lub szerokości.
    • Wyrównany do środka, ponieważ nie zachęca ludzi do porównywania wysokości

wprowadź opis zdjęcia tutaj

Na przykład powyżej trudno jest nie zauważyć kwadratu oznaczonego „5” jako trzy czwarte wysokości kwadratu oznaczonego „10”, więc jest to potencjalnie mylące.

Kręgi nie zapraszają do tego rodzaju porównania: jest to bardziej intuicyjny, natychmiastowy „Ten obiekt typu blob jest znacznie większy niż następny obiekt typu blob”.


Istnieje wiele dowodów, od testów przeprowadzanych przez użytkowników po badania na małą skalę (spróbujemy później wyłapać kilka przykładów), że tego rodzaju intuicyjne porównanie obszarowe może być bardziej angażujące, może obniżyć barierę wejścia do mniej zaangażowanych odbiorców i może pomagają skupić uwagę czytelnika na temacie, a nie na zimnych szczegółach liczb. Jest to jednak kosztem przeszkadzania w analizie opartej na liczbach.

Nie wybieraj między jednym wymiarem (długość lub odległość) a dwuwymiarowym (powierzchnia) ze względów estetycznych: wybieraj między nimi na podstawie odbiorców i przekazu.

Co jest bardziej odpowiednie dla komunikacji: natychmiastowe porównania na poziomie jelit na poziomie „to znacznie większe”, czy też bardziej rozważane porównania numeryczne na poziomie „to około 80% drugiego”?

Czy istnieją praktyczne powody, dla których musisz korzystać z obszaru?

Następnie, gdy wybrałeś ze względów praktycznych , zastosuj estetykę.

user56reinstatemonica8
źródło
„Proporcjonalna do ilości koloru na stronie” jest bardzo przydatną zasadą (przynajmniej w 2D); dzięki za to będę go używać. Projekt, do którego się przeprowadzam, oparty jest na kręgach, myślę, że tam jesteś
dumbledad
5

Powiedziałbym obszar. Opcjonalnie kwadrat o boku dwa razy dłuższym pokazuje jako obszar 4 razy większy. Przypadkowi obserwatorzy będą odnosić się do tego obszaru, nawet bez czytania twojej legendy.

Dobrym przykładem jest ten legendarny wykres autorstwa Randall Munroe xkcd :

wprowadź opis zdjęcia tutaj ( ogromna, czytelna wersja )

Vincent
źródło
4

Nie jesteśmy tak dobrzy w osądzaniu różnic w powierzchni, jak w długości. Używamy długości jako przybliżenia i dlatego nie doceniamy różnic w obszarach.

Z tego powodu okrąg, który faktycznie ma 2x powierzchnię innego, wydaje się zbyt mały, ponieważ nasz mózg odnosi swoje promienie, które różnią się 1,4-krotnie.

Interesujące są próby pogodzenia tego zjawiska, takie jak Proporcjonalne mapowanie symboli w R , które proponuje percepcyjne skalowanie symboli w celu ściślejszego dopasowania do tego, jak oceniamy długości i obszary.

Oto ryc. 2 z tego artykułu

wprowadź opis zdjęcia tutaj

Osobiście nie mam z tym żadnego doświadczenia i unikam korzystania z obszarów, jeśli wymagane są oceny ilościowe.

Ciekawą styczną jest związek między postrzeganiem objętości a długością. Różnica w ich postrzeganiu jest jeszcze bardziej uderzająca. Można to zilustrować na tym filmie porównującym rozmiary gwiazd .

Gdy dotrzesz do największej gwiazdy, która ma średnicę około 1700x średnicy Słońca, masz wrażenie, że jest ona znacznie większa niż 1700x.

Aby uzyskać bardziej systematyczne spojrzenie na nasz błąd w postrzeganiu różnic w obszarach i długościach, zobacz Crowdsourcing Graficzna percepcja: Używanie mechanicznego turka do oceny projektu wizualizacji autorstwa Jeffrey Heer i Michaela Bostocka.

Marcin Krzywiński
źródło
4

Moim zdaniem obszar (D), a nie każda strona (E).

Jeśli używasz boku o długości 2, obszar byłby 4 razy większy od wartości i miałbyś bardzo nakładający się wykres. (MI)

Gdy masz normalny wykres słupkowy (A), dane są liniowe, a oznaczenie słupka jest tylko estetyczne. (B)

W takich przypadkach obszar ponownie jest reprezentatywny dla danych, ponieważ oznaczenie słupków jest takie samo. Możesz mieć pasek 3D, a mimo to jego objętość odpowiada wartości danych (C)

Wykresy ilustrujące zmiany różnic percepcyjnych i nakładanie się

Rafael
źródło
4 razy? Czy to nie różnica między liniową a kwadratową?
dumbledad
Pozwól mi zilustrować i edytować post.
Rafael
Załóżmy, że punktem odniesienia jest 81. Jeśli używamy obszaru, boki mają długość 9, co daje pole 81. Jeśli robimy boki, mają one długość 81, a obszar wynosi 6561. 81 nie jest 4 razy 9, a 6561 nie jest 4 razy 81. Skąd bierzesz 4?
dumbledad
„Jeśli używasz boku o długości 2, obszar będzie czterokrotnie większy od wartości”. Nie mogę powiedzieć, co próbujesz tam powiedzieć. Myślę, że masz na myśli, że jeśli używasz długości boku do reprezentowania wielkości danych, podwojenie wartości danych mnoży obszar przez cztery.
David Richerby,
David - to moja edycja! Oryginalny post Rafaela powiedział „jeśli używasz boku, obszar byłby 4 razy większy niż wartość”. Jeśli znasz lepszy sposób, aby to wyjaśnić, zrób to.
dumbledad
1

Tufte poradził sobie z tym szeroko. Widzieć:

  • Wizualne wyświetlanie informacji ilościowych,
  • Przewidywanie informacji i innych.

Niektóre zasady integralności graficznej:

  1. Reprezentacja liczb mierzona fizycznie na powierzchni samego wykresu powinna być wprost proporcjonalna do reprezentowanych wielkości liczbowych
  2. Należy zastosować jasne, szczegółowe i dokładne oznakowanie, aby pokonać zniekształcenie graficzne i dwuznaczność. Wyjaśnij wyjaśnienia danych na samym wykresie. Oznacz ważne zdarzenia w danych.
  3. Pokaż zmienność danych, a nie zmienność projektu.
  4. W szeregach czasowych wyświetlania pieniędzy, deflowane i znormalizowane jednostki miary pieniężnej są prawie zawsze lepsze niż jednostki nominalne.
  5. Przedstawiona liczba wymiarów zawierających informacje (zmienne) nie powinna przekraczać liczby wymiarów w danych. Grafika nie może podawać danych poza kontekstem.

W twoim przypadku musisz zadać sobie pytanie, czy dane są lepiej reprezentowane przez obraz 2D lub 3D lub linię. Sześcian, kwadrat i linia to nie to samo. To jeden z powodów, dla których wykresy słupkowe 3D tak często wprowadzają w błąd.

Mayo
źródło