To pytanie dotyczące wizualizacji danych - mam nadzieję, że zadawanie tego pytania jest w porządku.
Kiedy należy zastosować wypełnienie pod wykresem liniowym dla szeregów czasowych, takich jak poniższy wykres? (który pokazuje czasy pingów w ciągu dnia)
Wydaje mi się, że bardziej powszechne jest stosowanie zwykłej linii bez wypełnienia poniżej, ale czy można używać wypełnienia dla różnorodności wizualnej?
Byłbym szczególnie zainteresowany wiedzą o wszelkich badaniach percepcyjnych na ten temat lub o poradnikach dotyczących stylu.
data-visualization
Richard
źródło
źródło
0s
naturalna dolna granica jest pokazana, to dlaczego nie?Odpowiedzi:
Jest trochę sztuki równoważenia estetycznych i informacyjnych aspektów grafiki. Wybitni konsultanci / autorzy wizualizacji, tacy jak Edward Tufte i Stephen Few, wybierają minimalną estetykę, która pozwala uniknąć odwracania uwagi od informacyjnych części wykresu. Jednak dla niektórych odbiorców niewielki rozkwit jest uzasadniony - patrz na przykład dziennikarskie zastosowanie wizualizacji danych przez Alberto Cairo.
Kąt percepcyjnego badania polega na tym, że każdy element graficzny przekazuje komunikat, z którego nie jesteśmy świadomi, ponieważ zajmuje się nim nasza kora wzrokowa („ przetwarzanie uważne ”). Dodatkowe elementy, nawet zbędne, mogą spowodować dodatkowe przetwarzanie. Odpowiedni wykres zależy od przekazu, który ma zostać przekazany, i odbiorców.
Do konkretnego pytania połączona linia podkreśla trend (i odchylenie od trendu). Wypełniony obszar podkreśla odchylenie od linii podstawowej. Wykres słupkowy lub igłowy podkreśliłby odrębne zdarzenia odbiegające od linii podstawowej.
Ważny jest także kontekst grafiki. Jeśli masz siatkę ciasno upakowanych wykresów, wypełnienie pomoże powiązać każdą linię z linią bazową.
Wreszcie, kolejną kwestią przy dodawaniu zbędnych elementów graficznych / elementów dekoracyjnych jest to, że trudniej jest rozszerzyć wykres o elementy bardziej informacyjne. Na przykład możesz chcieć wyróżnić specjalne wartości, nałożyć inne linie trendu lub nałożyć pasma, na przykład w poniższej makiecie.
źródło
Jeszcze kilka punktów do rozważenia:
Jak wspomniano w komentarzu, niedopełnienie jest w dużej mierze nieodpowiednie, jeśli oś x nie znajduje się w naturalnym punkcie zero. Może to być spowodowane tym, że oś y jest skalowana tak, aby zaczynała się od liczby innej niż zero, lub dlatego, że używane jednostki nie mają interpretacji naturalnego zera (np. Kelvin ma naturalne zero, a Celsjusz nie.)
Po drugie, przypadek, w którym niepełne wypełnienie jest szczególnie ważne, polega na tym, że same dane można uznać za niedopełnione. Na przykład wykres liniowy wysokości góry ma sens, że jest niewystarczająco wypełniony, kolor wypełnienia reprezentuje ziemię, a niewypełniony - powietrze.
Powiązanym przykładem mogą być dane zliczania. Gdybyśmy ułożyli wszystkie osobniki w każdym punkcie x, otrzymalibyśmy wykres słupkowy. Jeśli interpolacja między słupkami ma sens, otrzymalibyśmy wykres liniowy z niedopełnieniem.
Ten obraz z „wizualnego wyświetlania informacji ilościowych” może wyjaśnić to nieco lepiej. Pokazuje, które jednostki wojskowe były w Europie podczas drugiej wojny (tak mi się wydaje). Układanie jednostek w każdym punkcie czasowym daje niedopełniony wykres słupkowy. Narysowanie linii nad górą danych daje niewystarczająco wypełniony wykres liniowy.
źródło
Dwie poprzednie odpowiedzi dotyczą głównych ważnych punktów, ale jest kilka rzeczy, o których należy jeszcze wspomnieć.
Po pierwsze, powinienem powiedzieć, że nie zgadzam się z ekstremistycznym minimalistycznym podejściem do grafik - że cały nadmiarowy atrament musi zniknąć. Rozpraszające, pozbawione znaczenia odmiany powinny odejść. Ale jednolity obszar w porównaniu z pojedynczą linią może lepiej przyciągać wzrok i lepiej komunikować się na pierwszy rzut oka. I, jak mówisz, może dodać „różnorodność wizualną”.
Jednak, jak wskazuje @xan, to szybkie spojrzenie interpretuje obszar inaczej niż linię, w sposób częściowo podświadomy.
Wykres obszarowy oznacza łączną ilość gromadzącą się w miarę przemieszczania się wzdłuż osi x. Jeśli porównasz dwa wykresy, a jeden ma wypełniony większy obszar, twoje spojrzenie powie ci, że ma większą sumę niezależnie od wartości początkowej i końcowej.
Natomiast wykres liniowy pokazuje zmieniającą się wartość. Nacisk kładziony jest na zmianę pozycji z jednego punktu do następnego, a nie na łączną sumę.
Kiedy więc należy użyć wykresu powierzchniowego?
Chodzi o to, że podczas czytania wykresu, jeśli weźmiesz dwa punkty na osi x, pokazany między nimi obszar powinien reprezentować rzeczywistą ilość czegoś gromadzącego się w tym zakresie. Z tego powodu, jeśli wartości zawierają wartości ujemne, zalecam użycie przeciwnych kolorów dla obszarów ujemnych i dodatnich, aby podkreślić, że sumują się one w sumie.
Kiedy należy nie używać wykres okolicy?
Mając na uwadze te wytyczne, wykres ping można interpretować na dwa sposoby.
Z jednej strony, jeśli myślisz o szybkości pingowania jako o pojedynczej zmiennej, która zmienia się w ciągu dnia, najbardziej odpowiedni byłby prosty wykres liniowy.
Z drugiej strony, jeśli porównujesz codzienne wzorce prędkości ping dla dwóch różnych sieci (lub tej samej sieci w różnych dniach / okresach), być może zechcesz podkreślić całkowity czas potrzebny na zadania sieciowe. Na przykład, jeśli twój wykres miał wiele pików, zamiast jednego, wykres liniowy podkreślałby zmienność prędkości, podczas gdy wykres powierzchniowy podkreślałby całkowite opóźnienie.
Porównaj:
Łączna suma jest nieco większa w pierwszej połowie wykresu (na lewo od czerwonej linii) niż w drugiej, nawet jeśli szczyty osiągają wyższe wartości maksymalne po prawej stronie. Wypełnienie podkreśla ten solidny blok po lewej stronie, dzięki czemu lepiej równoważy się ze szczytami.
(Wybacz słabą jakość obrazu - nie mogłem wymyślić, jak skłonić R do wykonania wykresu powierzchniowego! Musiałem eksportować i edytować osobno.)
źródło