Skutecznie wyświetla dane demograficzne na wydrukowanej mapie

29

Chciałbym wydrukować następujące dane dla każdej strefy (łącznie 30 stref) na drukowanej / nieinteraktywnej mapie:

  • Średni wiek
  • Średni dochód gospodarstwa domowego
  • Liczba gospodarstw domowych
  • Gęstość zaludnienia
  • Liczba ludzi
  • Liczba pracowników

Jak efektywnie wyświetliłbyś powyższe 6 warstw na jednej mapie?

dassouki
źródło
1
Jak duże są strefy w stosunku do rozmiaru strony? Czy umieścisz małą działkę w każdej strefie? (np. mapa radarowa)
djq,
@celenius - Jest to typowy rodzaj ankiety przeprowadzonej podczas spisu powszechnego, w której strefy śródmieścia są znacznie mniejsze niż strefy mieszkalne, które są znacznie mniejsze niż strefy podmiejskie / wiejskie
dassouki,
1
Te 6 warstw na mapie statycznej to trudne zadanie projektowe. Na czym polega problem uniemożliwiający korzystanie z interaktywnej mapy?
Trevesy,
@Trevesy - w większości przypadków wymagane jest zaprojektowanie mapy do wydruku, która wyróżnia 6 zmiennych w celu promowania analizy wizualnej
dassouki
1
Pozwoliłem sobie dodać tag wizualizacji, możesz go usunąć, jeśli uważasz, że jest nieodpowiedni.
Andy W

Odpowiedzi:

20

Powiedziałbym, że nie możesz umieścić wszystkich tych danych na jednej mapie i mieć to jakikolwiek sens. Polecam, abyś pomyślał zgodnie z zasadą małych wielokrotności Tufte'a, mając wiele mniejszych map tego samego obszaru, z których każda używa innej zmiennej. Przykład: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Nawet wtedy masz problem z tym, że używasz kilku różnych jednostek, więc potrzebujesz kilku kluczy. Innym sposobem przeglądania danych (ale nie na mapie) byłoby użycie tabeli ze wszystkimi wartościami, pokolorowanymi (tj. - różne kolory dla poniżej średniej, średniej, powyżej średniej)

Poleciłbym również zajrzeć do atlasu spisów, aby uzyskać więcej pomysłów na mapy: http://www.census.gov/population/www/cen2000/censusatlas/

Może pomóc w dokładniejszym zastanowieniu się nad tym, jaką wiadomość chcesz przekazać, a nie dokładnie (jakie dane masz).

neuhausr
źródło
5
+1 Jest to o wiele lepsze niż bałagan, próbując symbolizować sześć zmiennych jednocześnie. Ponadto, dlaczego nie wydrukować tabeli danych? Sześć kolumn + identyfikator, 30 wierszy: jest wystarczająco mały i zawiera wszystkie szczegóły, których mógłby potrzebować każdy.
whuber
13

Nie można skutecznie wyświetlić tak dużej ilości danych na jednej mapie. Dwie możliwości:

  • Wyprodukuj 6 map,

  • Przeanalizuj dane, aby sklasyfikować regiony i wyświetlić wynik klasyfikacji. Analiza głównego składnika może pomóc w określeniu najważniejszych korelacji w obrębie zmiennej. Metodę tę wykorzystano do stworzenia tej syntetycznej mapy:

alternatywny tekst

z tych:

alternatywny tekst alternatywny tekst

Julien
źródło
Problem z posiadaniem 6 map polega na tym, że trudno jest wizualnie określić jakiekolwiek trendy. Czasami miło jest spojrzeć na mapę z wieloma zmiennymi i zobaczyć, jak się
układają
2
@dassouki, aby zobaczyć, jak rzeczy się układają, niekoniecznie musisz je mapować. Dwuwymiarowe wykresy rozproszenia spełniałyby te kryteria i byłyby znacznie łatwiejsze do interpretacji.
Andy W,
3
Zaletą posiadania 6 mapy jest to, że łatwo jest wizualnie zidentyfikować trendy! Kiedy próbujesz zgromadzić sześć (lub więcej) zmiennych na jednej mapie, znalezienie wzorów może być trudne. (Gdyby ta mapa zawierała tysiące funkcji, zmieniłbym to spostrzeżenie: niektóre rodzaje mapowania, takie jak wizualizacja glifów , mogą być niezwykle skuteczne w znajdowaniu wzorców w bogato wielowymiarowych zestawach danych: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber
@julien, Fajne rzeczy, możesz być zainteresowany tym artykułem, z którym właśnie natknąłem się, e-publications.org/ims/submission/index.php/AOAS/user/... , ma mapy z powiązaną analizą PCA podobnej wielowariantowej dane, a także kod R do tworzenia wykresów.
Andy W
Naprawdę interesujące, muszę o tym poczytać.
neuhausr
9

Zgadzam się, że małe wielokrotności są prawdopodobnie dobrym sposobem na rozwiązanie tego problemu. Aby uzupełnić mapę, sugerowałbym również macierz rozrzutu twoich zmiennych, która identyfikowałaby korelacje dwuwymiarowe. Podczas gdy tracisz aspekt geograficzny swoich danych, o wiele łatwiej jest zwizualizować relacje między zmiennymi na wykresie rozrzutu niż porównać dwie mapy (nawet obok siebie).

Jeśli nadal chcesz uchwycić pewien rodzaj trendów przestrzennych, możesz dołączyć statystyki przestrzenne (takie jak lokalny I Morana) między rozkładami i / lub zmiennymi oryginalnymi.

Edycja: Ostatnio natknąłem się na pracę nad przeglądaniem statystyk moralnych opublikowanych przez Andre-Michela Guerry'ego (pierwotnie w 1883 r.), Której celem jest wizualizacja różnorodnych relacji w przestrzeni. Implementacje tych autorów są bardzo podobne do tego, co zostało zasugerowane w tym wątku, małych wielokrotności, analizy głównych składników, macierzy wykresów rozrzutu i wewnątrz diagramów wielokątów. Załączone są zdjęcia z A.-M. Statystyki moralne Guerry we Francji: Wyzwania dla wielowymiarowej analizy przestrzennej autor: Michael Friendly Statistics Science, tom. 22, nr 3. (sierpień 2007), s. 368–399 ( plik PDF jest bezpłatny). Również inny artykuł ( Dray i Jombart, 2010 ) analizuje te same dane i ma trochę kodu źródłowego w R, aby tworzyć wspomniane wykresy.

Jedno zdjęcie to macierz wykresu rozrzutu, drugie to tak zwany diagram gwiazdy (który jest po prostu innym sposobem przedstawiania wykresów słupkowych, jak sugerował Pablo). alternatywny tekst alternatywny tekst

Andy W.
źródło
8

Oto wspaniały przykład małych mnożników opublikowanych na Andrew Gelman (i blogu firmy) Modelowanie statystyczne, wnioskowanie przyczynowe i nauki społeczne . Mapa stanowi poparcie wyborców dla bonów szkolnych według stanu, pod warunkiem uzyskania dochodów oraz różnych kategorii ras i religii. Biali nie-ewangelicy naprawdę nie lubią bonów szkolnych! (Jeśli przejdziesz do prawdziwego bloga, chociaż pojawia się on w danych z ankiety z 2004 r., Oznacza to, że w większym stopniu wspiera on kupony szkolne w tej grupie). wprowadź opis zdjęcia tutaj

Andy W.
źródło
Wykres jest fajny, ale skala kolorów jest okropna. Dlaczego 50% ma taki priorytet, ponieważ jest szary? Z pewnością powinien po prostu użyć kolorów mapy termicznej, czy coś? Ponadto, dlaczego tylko odrobina ludzi jest podzielona na religię? z pewnością byłoby bardziej sensowne podzielić według rasy, a następnie religii?
naught101
@ naught101, jestem trochę zdezorientowany twoją negatywnością. Z pewnością szary jest niedoceniony w porównaniu do jaśniejszych lub ciemniejszych kolorów na obu końcach spektrum. Chociaż nie podoba mi się arbitralnie rozbieżność na poziomie 45%, IMO przy tworzeniu małych wielu map takich jak te, warto mieć bardzo kontrastujące wartości. Komentarz na temat podziału religii / rasy nie ma większego sensu ani IMO. Są to kategorie, które są w oczywisty sposób ściśle powiązane z tym, czy dane wsparcie obsługuje kupony, i wydaje się, że niektóre z podzbiorów, które sugerujesz, nie istnieją. cd ...
Andy W
IE Wątpię, czy w ankiecie jest wystarczająco dużo „czarnych katolików”, aby powiedzieć coś merytorycznego na temat takiej grupy (ani „latynoskich protestantów nie-Evang). Sugerowałbym przeczytanie postu przez Gelmana i mam nadzieję, że to wyjaśni motywację do podgrupy
Andy W
może po prostu ten konkretny szary wystaje na mój ekran. Myślę, że lepiej byłoby z białym, a być może szarym tłem, żeby to odróżnić. Warto również zauważyć, że dwa obrazy na blogu Gelmana mają różne skale ... Miałem wrażenie, że czarna populacja była znacznie wyższa, ale po prostu spojrzałem na dane ze spisu powszechnego i poprawiłem stanowisko. Jedną z dziwnych rzeczy jest to, że spis określa latynoskie pochodzenie jako ortogonalne dla rasy (to osobne pytanie).
Wydaje
@ naught101 nie jest to informacja ze spisu, pochodzi z innej ankiety (spis nie ma na ten temat opinii publicznej)
Andy W
5

Aby wybrać między przedstawionymi tutaj rozwiązaniami, możesz podać dwie kluczowe informacje:

  • jaki jest cel mapy? (Odkryć, ujawnić?)
  • jaka jest zamierzona publiczność mapy? (Ty, koledzy analitycy, urbanista, publiczny?)

Rozwiązania cytowane tutaj mogą mieć różną wydajność w zależności od celu i społeczeństwa.

Chciałbym uogólnić odpowiedź Juliena (jedna mapa syntetyczna za pomocą PCA), powołując się na technikę diagonalizacji macierzy, opisaną przez J. Bertina. Jest to przydatne, gdy ktoś szuka syntezy wszystkich informacji, a nie pełnej prezentacji danych.

W skrócie, polega na reprezentowaniu każdej zmiennej za pomocą histogramu, sortowaniu stosu histogramów w taki sposób, aby wartości (strefy mapy) były wyrównane po przekątnej, aby uzyskać typologię:

alternatywny tekst

(Źródło: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )

Laurent Jégou
źródło
4

To dużo informacji i faktem jest, że jedna mapa łącząca je wszystkie w sposób tematyczny dałaby bezużyteczną prezentację z powodu zanieczyszczenia wizualnego. Z drugiej strony istnieje 30 stref, więc wiele map dla każdej strefy również spowodowałoby zanieczyszczenie.

Moje rozwiązanie: wybierz, która jest najważniejszą informacją, powiedzmy „dochód gospodarstwa domowego”, a następnie podziel mapę na kategorie według niektórych kategorii dochodów. I na koniec dla każdego miejsca dochodu, wykreśl czat barowy z innym 5 atrybutem.

Dzięki tej mapie można dokonać porównań, na przykład: „Obszary o wysokich dochodach zawsze pokazują dużą liczbę pracowników i średni wiek przekraczający 21 lat”.

Spójrz na przykład...

alternatywny tekst

Pablo
źródło
4

Być może niektóre z tych pomysłów mogłyby pomóc?

Zakładając, że masz sześć wymiarów:

1: Choropleth : Przykład dochodu gospodarstwa domowego 0

2, 3 i 4: Symbole : Liczba osób reprezentująca kropki, co pozwala zobaczyć tło: przykład 1, przykład 2 przy użyciu skali szarości dla pracowników / osób niebędących pracownikami oraz inny schemat kolorów pokazujący wiek

5: 3D : Wykorzystanie gęstości zaludnienia jako przykładu terenu 3

6: (Nie mogę wymyślić szóstego sposobu!)

Czy niepotrzebne jest wyświetlanie „liczby gospodarstw domowych”, „gęstości zaludnienia” i „liczby osób”?

Byłbym sceptyczny, gdyby mapa o takiej złożoności była zrozumiała dla każdego oprócz ciebie. Gdybym go przedstawiał, najpierw pokazywałbym każdy element osobno, a następnie dodawał go, aby widz mógł zrozumieć kroki.


Jednym z alternatywnych sposobów (jeśli nie masz miejsca na wykres radarowy dla każdej strefy, może być utworzenie „glifu” reprezentującego ten przykład informacyjny 4, rys . 10.28 . Myślę, że są one zwykle trudne do zrozumienia i niełatwe do zaprojektowania) oczywiście, ale w tym przypadku można zastosować powiązany przykład.


Inną myślą, jaką miałem, byłoby wyciągnięcie wielokątów na tę samą wysokość dla każdego wielokąta, a następnie użycie odcinka wysokości do przedstawienia tych parametrów. Podobne do tworzenia wykresu słupkowego dla każdego obszaru, ale gdzie każda sekcja jest ułożona na wierzchu w podobnych odstępach. Musiałoby to być oglądane z 3D, co oznaczałoby, że niektóre z nich byłyby zasłonięte.

djq
źródło
Kocham i mam na myśli wszystkie twoje sugestie. Planuję wdrożenie 1-> 4. Jednak jeśli chodzi o rzeczy 3d: uważam, że kiedy robisz mapy 3d, obszary śródmieścia, zwykle centralnie położone, zdobywają większość wysokości, blokując wiele stref za nimi
dassouki
@dassouki - Zgadzam się, że zwykle tak jest. Być może możesz użyć zmiennej, która nie ma dla tego dużego zakresu (średni wiek?), A jeśli tak, możesz ją logarytmicznie przekształcić.
djq,
3
@celenius Interesujące pytanie o możliwą redundancję: gęstość zaludnienia to liczba osób w stosunku do obszaru ; liczba osób jest liczbą bezwzględną ; a liczba gospodarstw domowych informuje o tym, jak ludzie żyją razem. Chociaż wyraźnie te trzy zmienne są powiązane (i mogą powodować problemy prawie kolinearne w regresjach), tak naprawdę są to trzy różne informacje. BTW, to „choropleth”. (Na szczęście Google rozpoznaje tę literówkę i mimo to dokonuje zamierzonego wyszukiwania.)
whuber
1
@ whuber - Myślę, że prawdopodobnie zrobiono to za pomocą flasha (niestety!).
djq,
2
Jestem bardzo podejrzliwy wobec sugestii 3D. AFAIK nikt nie pokazał, że 3D jest bardzo użyteczny. Link do przestępczości w San Fran działa, ale tylko dlatego, że jest bardzo prosty - bardziej skomplikowany wzorzec byłby trudny do odczytania. Nie sądzę, aby w tym przypadku w ogóle można było zastosować 3D.
Trevesy,
2

To trudne zadanie. Moja odpowiedź to pójść z mapą wielu odmian. Sprawdź tę mapę . Mapa będzie wyglądać na zajętą, jeśli pokażesz wszystkie zmienne na jednej mapie. Upewnij się, że wybierasz odpowiedni schemat kolorów, jeśli wybierasz mapę wielowymiarową.

Raj
źródło
Dokumenty Google są zablokowane tam, gdzie pracuję :(
dassouki,
też nie działał i nie mogę go zeskrobać, jeśli nie ma na końcu rozszerzenia pliku
dassouki
Nadal nie ma ....
dassouki,
to jest blok z mojej strony. :( Nie mam nic przeciwko wysyłaniu mapy e-mailem.
Raj
0

Jednym ze stopni uproszczenia byłoby wyrażenie jednego elementu, takiego jak gęstość zaludnienia, poprzez kartogram, tj. Zniekształcenie powierzchni każdej jednostki, tak aby była proporcjonalna do liczby ludności:

Wybory prezydenckie w USA w 2008 r
(źródło: amherst.edu )

Główną wadą jest to, że widz musi być w stanie rozpoznać zniekształcenie stref od ich „zwykłych” kształtów.

Więcej informacji tutaj: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf

Andy
źródło
1
Myślę, że ma to potencjał, ale nie jest jasne, jak dobrze kartogramy można zastosować w tej konkretnej sytuacji (jednocześnie oglądając wiele atrybutów na tej samej przestrzeni). Możesz teoretycznie wykonać wiele małych wielokrotnych kartogramów, ale może to być trudne do interpretacji (tracisz spójność między mapami, co jest w pewnym sensie niezbędne dla małych wielokrotności). Być może kartogram można połączyć z kolorem w bardziej interesujący sposób, aby pokazać wiele atrybutów.
Andy W
1
Przykład małych wielokrotnych kartogramów, gisandscience.com/2011/12/07/…
Andy W