Jak wybierasz klasyfikacje na mapach choropleth?

11

Podczas wyświetlania map choropleth (aka tematycznych) coraz trudniej mi zdefiniować punkty przerwania, aby inni mogli je zobaczyć . Czy ktoś ma jakieś sugerowane referencje, które pomagają w prowadzeniu, zarówno jak wybrać rodzaj zastosowanej skali i odpowiednią liczbę punktów przerwania? W szczególności dla liczby pojemników widziałem tylko argumenty za liczbą ograniczającą (np. Nie powinieneś używać więcej niż 5).


Aby być bardziej szczegółowym na temat tego, czego szukam, większość odniesień do których natknąłem się na ten temat jest podobny do dokumentu, do którego odwołuje się julien w tym poście , i szukam bardziej szczegółowej dyskusji na ten temat.

Kilka konkretnych przypadków użycia, z którymi często się spotykam (na przykład moich zmagań);

  • Podczas wyświetlania danych, które mają duże pochylenie w prawo, zwykle waham się przed wyświetleniem skali wykładniczej. Obawiam się (dla odbiorców, do których zazwyczaj wyświetlam mapy) spowodowałoby to większe obciążenie poznawcze podczas czytania skali i odwzorowywania rzeczywistych wartości atrybutów na kolory. Czy moje obawy są nieprawidłowe? Również dla tego rodzaju dystrybucji trudno jest uzasadnić określoną liczbę pojemników.
  • Jak wyświetlać wiele małych, wielu map, jak wybrać odpowiednią skalę, która pozwala skutecznie wizualizować relacje zarówno w obrębie małych wielokrotności, jak i między nimi? Moim de facto standardem, gdy skale atrybutów różnią się w znacznym stopniu, jest stosowanie kwintylów w każdym oddzielnym rozkładzie. Czy kwintyle to zbyt wiele klasyfikacji i zbyt duże obciążenie poznawcze, aby można je było porównać między panelami? Zakładam, że ludzie rozumieją, że klasyfikacje kwantylowe są równoważne rankingom (a zatem sklasyfikowanie ich w ten sposób pomaga w interpretacji między panelami), czy to założenie jest prawidłowe?

Początkowo napisałem akapit, próbując opisać cele takich map, ale podejrzewam, że moje cele są dość typowe, więc było niepotrzebne. Jedyną rzeczą do wyjaśnienia ponownie jest to, że są one do oglądania przez inne osoby (jak w raportach, publikacjach) i nie są tak naprawdę do mojej własnej analizy danych eksploracyjnych (chociaż podejrzewam, że dobra rada powinna się tłumaczyć na którąkolwiek). Być może dobre referencje mogą opisać potencjalne cele takich map oraz kompromisy związane z użyciem różnych schematów klasyfikacji. Byłbym zainteresowany zarówno szczegółowymi, jak i ogólnymi odniesieniami.

Andy W.
źródło
3
Chociaż nie jest to odpowiedź, jest to raczej koncepcja. Właśnie przeczytałem artykuł odnoszący się do „reguły 5 sekund” dla prezentacji, ale powinien on również dotyczyć map. „... umieść [mapę] na ekranie, usuń ją po pięciu sekundach, a następnie poproś widza o opisanie [mapy]. Gęsta [mapa] nie przejdzie testu - i nie zapewni podstawowej funkcji dowolnego obrazu : w celu ułatwienia prezentacji. ” forbes.com/sites/jerryweissman/2011/10/26/…
RyanKDalton
@RyanDalton, myśl jest zdecydowanie istotna w dyskusji i podejrzewam, że 5-sekundowy test nie różni się tak bardzo od tego, jak ludzie przeprowadzają eksperymenty na temat interpretacji grafiki statystycznej. Mam nadzieję, że nie muszę jednak przeprowadzać eksperymentów, aby wymyślić, jak stworzyć swoje schematy klasyfikacji! Uwaga Nie jestem pewien, jak dobrze mogę przeprowadzić na sobie 5-sekundowy test po tym, jak już dobrze znam dane, które wyświetlam.
Andy W
2
@Ryan „Reguła 5 sekund” pomaga wyjaśnić, dlaczego tak wiele prezentacji wydaje się tak głupich i mdłych. Mówi w zasadzie: „nie waż się pokazywać niczego, co jest na tyle bogate i interesujące, że mogłoby przyciągnąć uwagę publiczności i zaangażować ich”. Rzeczywiście, każdy z przykładów w wątku Piękne mapy „nie zda” tego testu. Zakładając, że mapa jest dobrze skonstruowany i wyjaśnił, być może w przypadku braku tego testu jest dobra rzecz!
whuber

Odpowiedzi:

6

Świetnym odniesieniem, niewystarczająco cytowanym, jest „How Maps Works” Alana M. McEachrena (The Guilford Press, 1995/2004). Nie jest to szybki przewodnik, ale kompleksowa refleksja na temat tego, jak mapy są widziane i rozumiane, w oparciu o naprawdę imponujące badania naukowe i wiedzę praktyków.

Laurent Jégou
źródło
1
Działa dobrze, jak zacząłem czytać to wczoraj wieczorem! Ostatnio natknąłem się na ten artykuł (Harrower and Brewer, 2003) dla aplikacji internetowej ColorBrewer, która sugeruje książce McEachren wybór liczby klasyfikacji. Poza tym znalazłem Monmoniera w Jak leżeć z mapami w dyskusji na temat nielogicznych schematów liczb / kolorów. Nie tak szczegółowy argument, jak tam szukałem, ale bardziej szczegółowy niż cokolwiek innego, co do tej pory znalazłem. Przejrzę odpowiednie sekcje w McEachren, aby sprawdzić, czy zaspokoi to moją ciekawość.
Andy W
2
Możesz także zajrzeć do „Kartografii tematycznej i wizualizacji” TA Slocum (Prentice Hall, 1999). Jest nieco starszy, ale był uczniem GF Jenks i uważam, że książka jest bardzo dostępna i bezpośrednio przydatna. Zawiera cały rozdział na temat klasyfikacji i ilustrację wskaźników złożoności mapy McEachrena.
Laurent Jégou,
4

Niedawno kupiłem Kartografię tematyczną i wizualizację ( Slocum i in., 2005 ) i po prostu przeglądanie wydaje się być więcej niż wystarczające do mojej prośby o ogólne referencje na temat wyboru pojemników. Z pewnością da mi to sporo do przeczytania przez dłuższy czas i nie była to zbyt żmudna decyzja o zakupie (krąży wiele starszych, tanich kopii).

Uwaga: Nie sądzę, że szczególnie poleciłbym MacEachrena, w jaki sposób działają mapy . Książka jest tak monolityczna, że ​​z pewnością mogłem zapomnieć, ale nie pamiętam żadnej prostej dyskusji na temat wyboru liczby pojemników (przynajmniej nie tak prostej, jak rozdział poświęcony jej w podręczniku Slocum). Jeśli coś, co myślę, pamiętam, że wspominał ten temat, jest nieco przesadzone i nie doszło do żadnych prawdziwych wniosków, ale z pewnością poleciłbym to jako ogólne odniesienie do wizualizacji danych.

Jest mnóstwo literatury na ten temat i będę musiał zrobić więcej samokształcenia, aby sprawdzić, czy uda mi się znaleźć bardziej zadowalającą odpowiedź na klasyfikację przekrzywionego rozkładu. Odpiszę, jeśli będę miał coś więcej do powiedzenia.

Ale w przypadku drugiego pytania na temat wizualizacji małych wielu map niedawno natknąłem się na artykuł Cynthii Brewer i Lindy Pickle, Ocena metod klasyfikacji danych epidemiologicznych na mapach Choropletha w serii ( tutaj PDF ), który jest dokładnie na moje pytanie.

Krótko mówiąc, eksperymenty sugerują, że kwantyle są najbardziej użytecznym sposobem przedstawienia serii małych wielu map, zarówno ze względu na łatwość interpretacji (jak zasugerowałem w pytaniu), jak i fakt, że tworzą one mapy równych obszarów pod względem wypełnienia, gdy wielokąty są mniej więcej tego samego rozmiaru. Być może nie jest to oczywiste, dopóki nie zobaczysz kontrprzykładu, poniżej wkleiłem zdjęcie kilku małych, wielu map, w których klasyfikacje są ograniczone, aby były równe w szeregu różnych wskaźników raka (na stronie 674 cytowanego artykułu).

wprowadź opis zdjęcia tutaj

Ponieważ częstość występowania chorób wątroby jest o wiele mniejsza niż POChP, wszystkie hrabstwa na najlepszych mapach mają tendencję do zaliczania się do niższych klasyfikacji. Jeśli nie potrafisz rozróżnić wzorów na jednej z map, prawdopodobnie nie rozróżnisz wzorów między mapami! Oczywiście, jeśli jest to uzasadnione, należy zapewnić spójność klasyfikacji, ale jest to uzasadnione tylko w przypadku niektórych map porównawczych. Także pod względem liczby pojemników wybrali 7 w swoich eksperymentach.

Andy W.
źródło
-1

zobacz ten ref. Optymalizacja wyboru liczby klas map Choropleth

w

T. Bandrova i in. (red.), Kartografia tematyczna dla społeczeństwa, Notatki z wykładu z geoinformacji i kartografii, DOI: 10.1007 / 978-3-319-08180-9_6, Springer International Publishing Switzerland 2014

Ali Al-Ghamdi
źródło
2
To odniesienie może być istotne, ale czy możesz napisać przynajmniej akapit podsumowujący jego treść, aby pomóc każdemu czytającemu twoją odpowiedź w podjęciu decyzji, czy warto ją znaleźć, czy nie?
PolyGeo