Dobry zasób online z poradami na temat graficznego powiązania dwóch zmiennych numerycznych w różnych warunkach

22

Kontekst:

Przez ten czas zyskałem zestaw heurystyk, jak efektywnie wykreślić powiązanie między dwiema zmiennymi numerycznymi. Wyobrażam sobie, że większość ludzi pracujących z danymi miałaby podobny zestaw reguł.

Przykładami takich reguł mogą być:

  • Jeśli jedna ze zmiennych jest dodatnio wypaczona, rozważ wykreślenie tej osi na skali logarytmicznej.
  • Jeśli istnieje wiele punktów danych (np. N> 1000), zastosuj inną strategię, na przykład stosując jakąś formę częściowej przezroczystości lub próbkując dane;
  • Jeśli jedna ze zmiennych przyjmuje ograniczoną liczbę dyskretnych kategorii, rozważ użycie drgań lub wykresu słonecznika;
  • Jeśli istnieją trzy lub więcej zmiennych, rozważ użycie macierzy wykresu rozrzutu;
  • Często przydatne jest dopasowanie jakiejś linii trendu;
  • Dostosuj rozmiar znaku kreślenia do wielkości próbki (dla większego n użyj mniejszego znaku kreślenia);
  • i tak dalej.

Pytanie:

Chciałbym móc skierować uczniów do strony internetowej lub witryny, która wyjaśnia te i inne sztuczki w celu skutecznego kreślenia powiązań między dwiema zmiennymi numerycznymi, być może z przykładami.

  • Czy są jakieś strony lub witryny w Internecie, które dobrze sobie z tym radzą?
Jeromy Anglim
źródło
2
Jeśli możesz go znaleźć, wydrukowany podręcznik „Grafika” dostarczony ze starszymi kopiami Systat (wcześniej niż Windows, wierz lub nie) byłby doskonałym zasobem. Nie tylko zilustrował wszystkie te zasady (o ile pamiętam), ale był pełen zwięzłej i doskonałej rady.
whuber
2
@ whuber, świetny komentarz. Leland Wilkinson, główny autor Systat, a także autor The Grammar of Graphics (która jest bardziej książką o informatyce niż książką statystyczną), ma bardzo dobry gust do graficznego wyświetlania danych. Jego prezentacje są zawsze bardzo skuteczne w dostarczaniu swoich wiadomości.
StasK
@Jeromy, możesz już znać pakiet ggplot2 dla R, ale teraz, gdy wspomniano o gramatyce grafiki, pomyślałem o tym. Uważam, że pakiet, książka i internetowy podręcznik Hadleya Wickhama są bardzo przydatne do przekształcania zmiennych numerycznych w przydatne wykresy i grafiki.
NRH
1
@Jeromy, dlaczego nie przeformułować pytania (osobno) jako wiki społeczności, żądając jednego posta na regułę? W ten sposób, zamiast zestawu linków, moglibyśmy mieć zestaw reguł do głosowania i stworzyć tutaj zasób.
David LeBauer
@David Okay, dodałem ogólne pytanie do społeczności na temat najlepszych zasobów do projektowania działek stats.stackexchange.com/questions/16631/…
Anglim

Odpowiedzi:

13

Nie mogę sobie wyobrazić wielkich zasobów internetowych, ale fajny (i łatwy do pobrania) rozdział w książce, który opowiada, jak wizualnie eksplorować duży, wielowymiarowy zestaw danych w przemyślany sposób, to Brendan O'Connor i Lukas Biewald's rozdział (ostrzeżenie: link jest bezpośrednio do pliku PDF) z Beautiful Data . Rozdział ten jest szczególnie przydatny jako materiał dydaktyczny, ponieważ włącza kod R do narracji.

Ponadto, po dalszej refleksji, myślę, że klasyczna książka Johna Tukeya „Some Graphic and Semigraphic Displays” (dogodnie opublikowana na stronie Edwarda Tufte'a) jest naprawdę cudownym, choć nieco idiosynkratycznym, wstępem do wizualizacji.

Z jakiegoś powodu wydaje mi się, że myślę o rozdziałach książek ...

popiołu
źródło
+1 Przynajmniej te rozdziały są dostępne w Internecie: Myślę, że to się kwalifikuje. Dzięki, Aaron.
whuber
@ whuber dzięki za wysłanie nagrody; i @ashaw oba linki stanowią ciekawą lekturę.
Jeromy Anglim
Zauważam, że artykuł Tukeya jest poprzednikiem rozszerzonego leczenia znalezionego w jego książce EDA (1977) (z wyjątkiem ostatniego rozdziału na temat zawieszania rootogramów i histogramów).
whuber
11

Najnowsze referencje:

Starsze, ale odpowiednie zasoby

David LeBauer
źródło
3
+1 Zasady i samouczki wyglądają na przydatne, kompleksowe i zabraniające! Jak można pisać o grafice bez podawania jednej ilustracji ? :-)
whuber
1
Wybór był trudny, ale przyznałem nagrodę za tę odpowiedź, ponieważ ogólnie najlepiej odpowiada na zadane pytanie. Dokument ONZ wydaje się szczególnie przydatny i dostępny dla studentów, z jego prostym językiem i wieloma wyraźnymi przykładami.
whuber