Czytałem książkę Tukeya „Analiza danych eksploracyjnych”. Książka, napisana w 1977 r., Podkreśla metody papierowe / ołówkowe. Czy istnieje bardziej „nowoczesny” następca, który bierze pod uwagę, że możemy teraz błyskawicznie wykreślić duże zbiory danych?
data-visualization
references
descriptive-statistics
eda
biofreezer
źródło
źródło
Odpowiedzi:
Najbliższe są wizualizujące dane Clevelanda . Chodzi o analizę danych eksploracyjnych, wizualizacje generowane komputerowo, głębokie, klasyczne.
źródło
Cóż, nie jest to dokładna replika, ale znalazłem mnóstwo użytecznych rad dotyczących kreślenia (i kodu R) w analizie danych Gelmana i Hilla za pomocą regresji i modeli wielopoziomowych / hierarchicznych
Ponadto jego blog jest często pełen przydatnych porad graficznych.
źródło
Interaktywna grafika do analizy danych: lubię zasady i przykłady ; opis książki mówi, że „omawia eksploracyjną analizę danych (EDA) oraz w jaki sposób interaktywne metody graficzne mogą pomóc w uzyskaniu wglądu, a także w generowaniu nowych pytań i hipotez z zestawów danych”.
źródło
Książka ggplot2 Hadleya Wickhama jest interesująca, ponieważ uczy zarówno gramatyki grafiki, jak i korzystania z oprogramowania ggplot2.
źródło
Warto tutaj wspomnieć o eksploracji danych w inżynierii, naukach i medycynie Ronalda Pearsona . Wydaje się, że głównym celem czytelników są naukowcy, którzy nie boją się matematyki, którzy chcieliby wiedzieć więcej statystyk. To dość duża grupa i dobrze tu reprezentowana. Jest trochę dziwaczny i niecodzienny, ale obejmuje wiele gruntów i zawiera wiele rozsądnych rad. Nie jest ponownie odwiedzany przez Tukeya w tym sensie, że oferuje wiele nowych pomysłów, ale studiowanie może być satysfakcjonujące, nawet jeśli uważasz, że jest to trochę niewłaściwe.
Wydaje się, że ta książka przyciągnęła bardzo mało uwagi, być może dlatego, że jest bardzo droga, oczywiście nie nadaje się jako tekst kursu, a jak dotąd jest dostępna tylko w twardej oprawie. Ale jest inteligentny i czytelny i wolny od śmieci współczesnych podręczników wprowadzających (strony i strony podstawowych ćwiczeń, głupie ikony, bezpłatne zdjęcia szczęśliwych młodych ludzi, wybredny układ z pudełkami, cokolwiek, itp.).
źródło
Również interaktywna i dynamiczna grafika do analizy danych: z przykładami wykorzystującymi R i GGobi, Cook i Swayne
Zawiera dwa rozdziały publicznie dostępne w Internecie, które opisują proces analizy danych i obsługę brakujących wartości. Niedługo pojawi się nowa książka Antony Unwin.
źródło
Kolejnymi dobrymi książkami do przeczytania są Piękna wizualizacja i Piękne dane. Są to zredagowane książki, są zadziwiająco dobre przykłady eksploracji danych za pomocą wykresów i niektóre absolutnie przerażające rozdziały.
Kolejną książką, która ma kilka dobrych przykładów użycia ggplot2, jest nowa książka Winstona Changa
źródło
Myślę o zrozumieniu solidnej i eksploracyjnej analizy Hoaglina, Mostellera i Tukeya oraz towarzyszącego mu tomu dotyczącego eksploracji tabel i kształtów danych jako technicznej kontynuacji EDA. Widzę także analizę danych i regresję, drugi kurs statystyki Mostellera i Tukeya jako kontynuację EDA. Różne wyżej wymienione książki Cleveland to skarby.
źródło