Kontekst:
Przez ten czas zyskałem zestaw heurystyk, jak efektywnie wykreślić powiązanie między dwiema zmiennymi numerycznymi. Wyobrażam sobie, że większość ludzi pracujących z danymi miałaby podobny zestaw reguł.
Przykładami takich reguł mogą być:
- Jeśli jedna ze zmiennych jest dodatnio wypaczona, rozważ wykreślenie tej osi na skali logarytmicznej.
- Jeśli istnieje wiele punktów danych (np. N> 1000), zastosuj inną strategię, na przykład stosując jakąś formę częściowej przezroczystości lub próbkując dane;
- Jeśli jedna ze zmiennych przyjmuje ograniczoną liczbę dyskretnych kategorii, rozważ użycie drgań lub wykresu słonecznika;
- Jeśli istnieją trzy lub więcej zmiennych, rozważ użycie macierzy wykresu rozrzutu;
- Często przydatne jest dopasowanie jakiejś linii trendu;
- Dostosuj rozmiar znaku kreślenia do wielkości próbki (dla większego n użyj mniejszego znaku kreślenia);
- i tak dalej.
Pytanie:
Chciałbym móc skierować uczniów do strony internetowej lub witryny, która wyjaśnia te i inne sztuczki w celu skutecznego kreślenia powiązań między dwiema zmiennymi numerycznymi, być może z przykładami.
- Czy są jakieś strony lub witryny w Internecie, które dobrze sobie z tym radzą?
data-visualization
correlation
teaching
rule-of-thumb
scatterplot
Jeromy Anglim
źródło
źródło
Odpowiedzi:
Nie mogę sobie wyobrazić wielkich zasobów internetowych, ale fajny (i łatwy do pobrania) rozdział w książce, który opowiada, jak wizualnie eksplorować duży, wielowymiarowy zestaw danych w przemyślany sposób, to Brendan O'Connor i Lukas Biewald's rozdział (ostrzeżenie: link jest bezpośrednio do pliku PDF) z Beautiful Data . Rozdział ten jest szczególnie przydatny jako materiał dydaktyczny, ponieważ włącza kod R do narracji.
Ponadto, po dalszej refleksji, myślę, że klasyczna książka Johna Tukeya „Some Graphic and Semigraphic Displays” (dogodnie opublikowana na stronie Edwarda Tufte'a) jest naprawdę cudownym, choć nieco idiosynkratycznym, wstępem do wizualizacji.
Z jakiegoś powodu wydaje mi się, że myślę o rozdziałach książek ...
źródło
Najnowsze referencje:
Kelleher i Wagner 2011 „Dziesięć wytycznych dotyczących skutecznej wizualizacji danych w publikacjach naukowych” zawiera niezły zestaw reguł. Reguły z odniesieniami (ale nie pełny artykuł) są dostępne bez subskrypcji, chociaż studenci prawdopodobnie mieliby pełny dostęp.
Organizacja Narodów Zjednoczonych z 2009 r. „Uczynienie danych sensownymi” zawiera ładny przegląd, zawierający zasady i przykłady, w tym rozdział dotyczący „powstających technologii”.
Starsze, ale odpowiednie zasoby
SIGGGRAPH zapewnia kilka doskonałych samouczków, choć brakuje przykładów, w tym:
Senay i Ignatius 1999 „Reguły i zasady wizualizacji danych naukowych”
Domik 1999 „Samouczek wizualizacji”
Dobre podsumowanie Tufte można znaleźć tutaj:
źródło